Teoria do significado do texto - Meaning–text theory

A teoria do significado do texto ( MTT ) é uma estrutura teórica linguística , apresentada pela primeira vez em Moscou por Aleksandr Žolkovskij e Igor Mel'čuk , para a construção de modelos de linguagem natural. A teoria fornece uma base ampla e elaborada para a descrição linguística e, devido ao seu caráter formal , se adapta particularmente bem a aplicativos de computador , incluindo tradução automática , fraseologia e lexicografia .

Níveis de representação

Os modelos linguísticos na teoria do texto-significado operam no princípio de que a linguagem consiste em um mapeamento do conteúdo ou significado (semântica) de um enunciado para sua forma ou texto (fonética). Os níveis intermediários entre esses pólos são níveis adicionais de representação nos níveis sintático e morfológico.

Níveis de representação na teoria do texto do significado

As representações nos diferentes níveis são mapeadas, em sequência, da rede desordenada da representação semântica (SemR) através das estruturas de árvore de dependência da representação sintática (SyntR) para uma cadeia linearizada de morfemas da representação morfológica (MorphR) e, em última análise, a seqüência ordenada temporalmente de telefones da representação fonética (PhonR) (geralmente não abordada no trabalho desta teoria). As relações entre as representações nos diferentes níveis são consideradas traduções ou mapeamentos, ao invés de transformações, e são mediadas por conjuntos de regras, chamadas de "componentes", que garantem as transições adequadas e específicas da linguagem entre os níveis.

Representação semântica

As representações semânticas (SemR) na teoria do texto de significado consistem principalmente em uma estrutura semântica semelhante à da web (SemS) que se combina com outras estruturas de nível semântico (mais notavelmente a estrutura semântico-comunicativa [SemCommS], que representa o que é comumente referido como " estrutura de informação " em outras estruturas). O próprio SemS consiste em uma rede de predicações , representadas como nós com setas que vão de nós de predicado a nós de argumento . Os argumentos podem ser compartilhados por vários predicados, e os próprios predicados podem ser argumentos de outros predicados. Os nós geralmente correspondem a significados lexicais e gramaticais, já que são expressos diretamente por itens no léxico ou por meios flexionais, mas a teoria permite a opção de decompor significados em uma representação mais refinada por meio de processos de paráfrase semântico, que também são fundamentais para lidar com com sinonímia e equivalências de tradução entre as línguas. SemRs são mapeados para o próximo nível de representação, a representação sintática profunda, pelas regras do componente semântico, que permite uma relação um para muitos entre os níveis (ou seja, um SemR pode ser potencialmente expresso por uma variedade de estruturas sintáticas , dependendo da escolha lexical, da complexidade do SemR, etc.). A descrição estrutural e a geração (semi-) automática de SemR estão sujeitas a pesquisas. Aqui, a decomposição aproveita os primos semânticos da metalinguagem semântica natural para determinar um critério de terminação da decomposição.

Representação sintática

As representações sintáticas (SyntR) na teoria do texto de significado são implementadas usando árvores de dependência , que constituem a estrutura sintática (SyntS). SyntS é acompanhado por vários outros tipos de estrutura, mais notavelmente a estrutura comunicativa sintática e a estrutura anafórica. Existem dois níveis de sintaxe na teoria do texto de significado, a representação sintática profunda (DSyntR) e a representação sintática de superfície (SSyntR). Uma boa visão geral da sintaxe da teoria do texto do significado, incluindo sua aplicação descritiva, pode ser encontrada em Mel'čuk (1988). Um modelo abrangente de sintaxe de superfície em inglês é apresentado em Mel'čuk e Pertsov (1987).

A representação sintática profunda (DSyntR) está diretamente relacionada ao SemS e busca capturar os aspectos "universais" da estrutura sintática. As árvores neste nível representam relações de dependência entre lexemas (ou entre lexemas e um inventário limitado de entidades abstratas, como funções lexicais ). Relações sintáticas profundas entre lexemas em DSyntR são restritas a um inventário universal de uma dúzia de relações sintáticas, incluindo sete relações atuariais classificadas (argumento), a relação modificativa e a relação coordenativa. Lexemes com função puramente gramatical, como preposições governadas lexicamente, não são incluídos neste nível de representação; valores de categorias flexionais que são derivados de SemR, mas implementados pela morfologia, são representados como subscritos nos nós lexicais relevantes aos quais eles se relacionam. DSyntR é mapeado para o próximo nível de representação por regras do componente sintático profundo.

A representação sintática de superfície (SSyntR) representa a estrutura sintática específica da linguagem de um enunciado e inclui nós para todos os itens lexicais (incluindo aqueles com função puramente gramatical) na frase. As relações sintáticas entre itens lexicais neste nível não são restritas e são consideradas completamente específicas do idioma, embora muitos sejam considerados semelhantes (ou pelo menos isomórficos) entre os idiomas. SSyntR é mapeado no próximo nível de representação por regras do componente sintático de superfície.

Representação morfológica

As representações morfológicas (MorphR) na teoria do texto de significado são implementadas como cadeias de morfemas organizadas em uma ordem linear fixa refletindo a ordem dos elementos no enunciado real. Este é o primeiro nível representacional no qual a precedência linear é considerada linguisticamente significativa, efetivamente agrupando a ordem das palavras junto com os processos morfológicos e a prosódia , como um dos três meios não lexicais com os quais as línguas podem codificar a estrutura sintática. Tal como acontece com a representação sintática, existem dois níveis de representação morfológica - representação morfológica profunda e de superfície. Descrições detalhadas das representações morfológicas da teoria do significado do texto são encontradas em Mel'čuk (1993-2000) e Mel'čuk (2006).

A representação morfológica profunda (DMorphR) consiste em cadeias de lexemas e morfemas - por exemplo, THE SHOE + { PL } ON BILL + { POSS } FOOT + { PL }. O componente morfológico profundo das regras mapeia essa string na representação morfológica da superfície (SMorphR), convertendo morfemas nos morfos apropriados e realizando operações morfológicas implementando processos morfológicos não concatenativos - no caso do nosso exemplo acima, dando us / the shoe + s nos pés do Bill + s /. As regras do componente morfológico da superfície, um subconjunto das quais inclui regras morfofonêmicas, mapeiam o SMorphR em uma representação fonética [ðə ʃuz on bɪlz fi: t].

O léxico

Um aspecto crucial da teoria do texto de significado é o léxico, considerado um catálogo abrangente das unidades lexicais (LUs) de uma língua, sendo essas unidades os lexemas, colocações e outros frases , construções e outras configurações de elementos linguísticos que são aprendido e implementado na fala por usuários da linguagem. O léxico na teoria do texto de significado é representado por um dicionário combinatório explicativo (ECD) que inclui entradas para todas as LUs de uma língua junto com as informações que os falantes devem saber sobre sua sintaxe (as regras e condições específicas da LU em suas combinatórias). Um ECD para o russo foi produzido por Mel'čuk et al. (1984), e os ECDs para o francês foram publicados como Mel'čuk et al. (1999) e Mel'čuk & Polguère (2007).

Funções lexicais

Uma descoberta importante da linguística de texto de significado foi o reconhecimento de que LUs em uma linguagem podem ser relacionados uns aos outros em um sentido semântico abstrato e que essa mesma relação também se aplica a muitos pares ou conjuntos de LUs lexicamente não relacionados. Essas relações são representadas na teoria do texto-significado como funções lexicais (LF). Um exemplo de um simples LF é Magn (G), que representa colocações utilizados na intensificação, tais como chuva forte , o vento forte , ou bombardeamento intenso . Um falante de inglês sabe que para um dado lexema L, como RAIN, o valor de Magn (RAIN) = HEAVY, enquanto Magn (WIND) = STRONG e assim por diante. A teoria do texto de significado atualmente reconhece várias dezenas de LFs padrão que são conhecidos por ocorrerem em vários idiomas.

Veja também

Referências

Leitura adicional

visões gerais

Em geral

  • Žolkovskij, AK e Mel'čuk, Igor A. (1965). O vozmožnom metode i instrumentax semantičeskogo sinteza (Sobre um possível método e instrumentos para síntese semântica). Naučno-texničeskaja informacija 5, 23–28.
  • И. А. Мельчук . Опыт теории лингвистических моделей «Смысл ↔ Текст». М., 1974 (2ª ed., 1999).
  • И. А. Мельчук. Русский язык в модели «Смысл ↔ Текст». Москва-Вена, 1995.
  • IA Mel'čuk. Vers une linguistique Sens-Texte. Leçon inaugurale. P .: Collège de France, Chaire internationale, 1997.
  • Leo Wanner (ed.), Tendências Recentes na Teoria do Texto de Significado. Amsterdam, Philadelphia: J. Benjamins Pub., 1997. ISBN   1-55619-925-2 , ISBN   90-272-3042-0
  • IA Bolshakov, AF Gelbukh. O modelo de texto de significado: trinta anos após J. International Forum on Information and Documentation, FID 519, ISSN 0304-9701, N 1, 2000.

Sintaxe

  • И. А. Мельчук. Поверхностный синтаксис русских числовых выражений. Wien: Wiener Slawistischer Almanach, 1985.
  • IA Mel'čuk & NV Pertsov. Sintaxe de superfície do inglês: um modelo formal dentro da estrutura de texto de significado. Amsterdam, Philadelphia: Benjamins, 1987. ISBN   90-272-1515-4
  • IA Mel'čuk. Sintaxe de dependência: Teoria e prática. Albany, NY: SUNY, 1988. ISBN   0-88706-450-7 , ISBN   0-88706-451-5
  • IA Mel'čuk. Atantes em Semântica e Sintaxe. I, II, Linguistics, 2004, 42: 1, 1-66; 42: 2, 247-291.

Morfologia

  • IA Mel'čuk. Cours de morphologie générale, vol. 1-5. Montreal: Les Presses de l'Université de Montréal / Paris: CNRS Éditions, 1993-2000
  • IA Mel'čuk. Aspectos da Teoria da Morfologia. Berlim; Nova York: Mouton de Gruyter, 2006. ISBN   3-11-017711-0

Lexicografia

  • IA Mel'čuk, AK Zholkovsky, Ju. D. Apresjan et al. Explicativa Combinatória Dictionary of Modern russo: semântico-sintática Estudos de russo Vocabulário / Толково-комбинаторный словарь современного русского языка: Опыты семантико-синтаксического описания русской лексики. Wien: Wiener Slawistischer Almanach, 1984.
  • IA Mel'čuk, A. Clas & A. Polguère. Introdução à lexicologie explicative et combinatoire. P: Duculot, 1995. - ISBN   2-8011-1106-6
  • IA Mel'čuk et al. Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques IV, Montreal: Les Presses de l'Université de Montréal, 1999. - ISBN   2-7606-1738-6

links externos

Significado - software de texto