Aglutinação - Agglutination

O sinal do meio está em húngaro , que se aglutina amplamente. (Os sinais superior e inferior estão em romeno e alemão , respectivamente, ambos os idiomas flexionados .) A tradução em inglês é "Ministério da Alimentação e Agricultura: Diretoria Geral de Alimentos e Agricultura do Condado de Satu Mare ".

Aglutinação é um processo linguístico de morfologia derivacional em que palavras complexas são formadas por morfemas amarrados juntos sem alterá-los na grafia ou fonética. As línguas que usam aglutinação amplamente são chamadas de línguas aglutinativas . Um exemplo de tal língua é o turco , onde, por exemplo, a palavra evlerinizden , ou "de suas casas", consiste nos morfemas ev-ler-iniz-den, literalmente traduzido morfema-por-morfema como casa-plural-sua -de .

As línguas aglutinativas são frequentemente contrastadas tanto com as línguas nas quais a estrutura sintática é expressa apenas por meio da ordem das palavras e palavras auxiliares ( línguas isoladas ) quanto com as línguas nas quais um único afixo normalmente expressa várias categorias sintáticas e uma única categoria pode ser expressa por vários diferentes afixos (como é o caso nas línguas flexionais (fusionais) ). No entanto, as linguagens fusional e de isolamento podem usar aglutinação nas construções mais frequentemente usadas e usar aglutinação fortemente em certos contextos, como a derivação de palavras. Esse é o caso do inglês , que tem um marcador plural aglutinado - (e) se palavras derivadas como shame · less · ness .

Os sufixos aglutinativos são freqüentemente inseridos independentemente dos limites silábicos , por exemplo, adicionando uma consoante à coda da sílaba como em tie-tie s em inglês . As línguas aglutinativas também têm grandes estoques de enclíticos , que podem ser e são separados da raiz da palavra por falantes nativos de uso diário.

O termo aglutinação é às vezes usado de forma mais geral para se referir ao processo morfológico de adicionar sufixos ou outros morfemas à base de uma palavra. Este assunto é tratado com mais detalhes na seção sobre outros usos do termo .

Exemplos de linguagens aglutinativas

Embora a aglutinação seja característica de certas famílias de línguas, isso não significa que, quando várias línguas em uma determinada área geográfica são todas aglutinativas, elas estão necessariamente relacionadas filogeneticamente. No passado, essa suposição levou os lingüistas a propor a chamada família de línguas ural-altaicas , que incluía (no maior escopo já proposto) as línguas urálica e turca, bem como mongol, coreano e japonês. A lingüística contemporânea vê essa proposta como controversa.

Outra consideração ao avaliar a proposta acima é que algumas línguas, que se desenvolveram a partir de protolinguagens aglutinativas, perderam suas características agluinativas. Por exemplo, o estoniano contemporâneo, que está tão intimamente relacionado ao finlandês que as duas línguas são mutuamente inteligíveis, mudou para o tipo fusional. (Ele também perdeu outras características típicas das famílias Uralic, como harmonia vocálica .)

Eurásia

Exemplos de línguas aglutinantes incluem as línguas Uralic , como finlandês , estoniano e húngaro . Eles têm expressões altamente aglutinadas no uso diário, e a maioria das palavras são bissilábicas ou mais longas. A informação gramatical expressa por adposições em línguas indo-europeias ocidentais é normalmente encontrada em sufixos.

O húngaro usa aglutinação extensa em quase todas as partes dele. Os sufixos seguem uns aos outros em uma ordem especial com base na função do sufixo, e muitos podem ser empilhados, um sobre o outro, resultando em palavras que transmitem significados complexos em formas compactadas. Um exemplo é fiaiéi, onde a raiz "fi (ú) -" significa "filho", as quatro vogais subsequentes são sufixos separados e a palavra inteira significa "[propriedades no plural] pertencem a seus filhos". A estrutura possessiva aninhada e a expressão dos plurais são bastante notáveis ​​(observe que o húngaro não usa gêneros).

Quase todas as línguas austronésias , como o malaio e a maioria das línguas filipinas , também pertencem a essa categoria, permitindo-lhes formar novas palavras a partir de formas básicas simples. A palavra indonésia e malaia mempertanggungjawabkan é formada pela adição de afixos de voz ativa, causativo e benéfico ao verbo composto tanggung jawab , que significa "explicar". Em tagalo (e seu registro padronizado, filipino ), nakakapágpabagabag ("aquilo que é perturbador / perturbador") é formado a partir da raiz bagabag ("perturbador" ou "perturbador").

O japonês também é uma língua aglutinante, agregando informações como negação , voz passiva , pretérito , grau honorífico e causalidade na forma verbal. Exemplos comuns seriam hatarakaseraretara (働 か せ ら れ た ら) , que combina conjugações causativas, passivas ou potenciais e condicionais para chegar a dois significados dependendo do contexto "se (sujeito) tivesse funcionado ..." e "se (sujeito) poderia fazer (objeto) funcionar ", e tabetakunakatta (食 べ た く な か っ た) , que combina desejo, negação e conjugações de pretérito para significar" Eu / ele / ela / eles não queriam comer ".

  • taberu ("(sujeito) vai comer (isso)")
  • tabetai ("(sujeito) quer comer (isso)")
  • tabetakunai ("(sujeito) não quer comer (isso)")
  • tabetakunakatta ("(assunto) não queria comer (isso)")

O turco , junto com todas as outras línguas turcas , é outra língua aglutinante: como um exemplo extremo, a expressão Muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine é pronunciada como uma palavra em turco, mas pode ser traduzida para o inglês como "como se você fosse daqueles que não seríamos capazes para se tornar um criador de pessoas malsucedidas "(o" -siniz "refere-se à sua forma plural com" -sin "sendo a forma singular, da mesma forma" -im "sendo" eu "e" -imiz "tornando-se "nós").

Todas as línguas dravídicas , incluindo Kannada , Malayalam , Tamil e Telugu são aglutinantes.

Aglutinação também é uma característica notável do basco . A conjugação de verbos, por exemplo, é feita adicionando diferentes prefixos ou sufixos à raiz do verbo: dakartzat , que significa "Eu os trago", é formado por da (indica o presente), kar (raiz do verbo ekarri → trazer), tza (indica plural) e t (indica sujeito, neste caso, "eu"). Outro exemplo seria a declinação: Etxean = "Na casa" onde etxe = casa.

África

Todos os idiomas Bantu , como KiKongo , IsiZulu , ChiChewa , LuGanda e Swahili .

Línguas senegambianas como wolof e fula .

Línguas igboides .

Américas

Assine em espanhol, inglês e kichwa , uma língua aglutinante.

Aglutinação é muito usada na maioria das línguas nativas americanas , como as línguas Inuit , Nahuatl , Mapudungun , Quechua , Tz'utujil , Kaqchikel , Cha'palaachi e K'iche , onde uma palavra pode conter morfemas suficientes para transmitir o significado do que seria uma frase complexa em outras línguas. Por outro lado, o Navajo contém afixos para alguns usos, mas os sobrepõe de maneiras tão imprevisíveis e inseparáveis ​​que costuma ser chamado de linguagem fusional.

Construído

Esperanto é uma língua auxiliar construída com gramática altamente regular e morfologia de palavras aglutinantes. Veja o vocabulário do Esperanto .

Fictício

Novilíngua é uma linguagem fictícia em 1984 com base no único objetivo de aglutinação, conforme expresso pelo personagem Syme, "Todo conceito que possa ser necessário será expresso por exatamente uma palavra" Por exemplo, usando a palavra raiz "bom", podemos formar palavras como goodly (faz bem), plusgood (muito bom), doubleplusgood (muito bom) e ungood (bad). Palavras com significados comparativos e superlativos também são simplificados, então "melhor" torna-se "bom" e "melhor" torna-se "melhor".

Slots

Como observado acima, é uma característica típica das línguas aglutinativas que haja uma correspondência um-para-um entre sufixos e categorias sintáticas. Por exemplo, um substantivo pode ter marcadores separados para número, caso, uso possessivo ou conjunto etc. A ordem desses afixos é fixa; assim, podemos ver qualquer substantivo ou verbo como um radical seguido por vários "slots" flexionais, isto é, posições em que os sufixos flexionais podem ocorrer. Freqüentemente, a instância mais comum de uma determinada categoria gramatical não está marcada, ou seja, o afixo correspondente está vazio.

O número de slots para uma determinada classe gramatical pode ser surpreendentemente alto. Por exemplo, um verbo coreano finito tem sete slots (os colchetes internos indicam partes de morfemas que podem ser omitidos em alguns ambientes fonológicos):

  1. honorífico: - (eu) si ((으) 시) é usado quando o falante está honrando o sujeito da frase
  2. tempo: (e o) ss (었) para ação ou estado concluído (passado); quando este slot está vazio, o tempo é interpretado como presente (o 'ss' é pronunciado como 't' se for colocado atrás de uma consoante. Por exemplo, - 었어 (eoss-eo) é pronunciado como (eosseo), mas - 었다 (eoss-ta) é pronunciado como (eotta). Observe que a mesma regra se aplica a todas as instâncias da desinência 'ss'.)
  3. aspecto experiencial-contrastivo: (eo) ss (었) dobrar o marcador de pretérito significa "o sujeito teve a experiência descrita pelo verbo"
  4. modal: gess (겠) é usado com sujeitos de primeira pessoa apenas para futuro definido e com sujeitos de segunda ou terceira pessoa também para presente ou passado provável
  5. formal: (eu) pni ((으) ㅂ니) expressa polidez com o ouvinte
  6. aspecto retrospectivo: deo ; (더) indica que o falante lembra o que observou no passado e relata na situação presente
  7. modo: da (다) para declarativo, kka (까) para interrogativo, ra / la (라) para imperativo, ja (자) para propositivo, yo (요) para declarativo educado e um grande número de outros marcadores de humor possíveis

Além disso, as formas verbais passivas e causais podem ser derivadas adicionando sufixos à base, o que pode ser visto como o nulo-ésimo slot.

Mesmo que algumas combinações de sufixos não sejam possíveis (por exemplo, apenas um dos espaços de aspecto pode ser preenchido com um sufixo não vazio), mais de 400 formas verbais podem ser formadas a partir de uma única base. Aqui estão alguns exemplos formados a partir da raiz da palavra ga 'to go'; os números indicam quais slots contêm sufixos não vazios:

  • 7 (marcador de modo imperativo): o sufixo imperativo -ra (라) combina com a raiz ga- (가) para expressar o imperativo: ga-ra (가라) 'Vá!';
  • 7 (marcador de modo propositivo): se quisermos expressar proposição em vez de comando, o marcador de modo propositivo é usado: -ja (자) em vez de -ra (라): ga-ja (가자) 'Vamos!'
  • 5 e 7: Se o falante quiser mostrar respeito pelo ouvinte, ele usa o marcador de polidez - (eu) pni ((으) ㅂ니) (no slot 5); vários marcadores de humor podem ser usados ​​simultaneamente (no slot 7, portanto, após o marcador de polidez): gap-ni-da (갑니다) 'Ele está indo.', gap-ni-kka? (갑니까) 'Ele está indo?'
  • 6: aspecto retrospectivo: Jon-i jib-e ga-deo-ra (존 이 집 에 가 더라) 'Eu observei que John estava indo para casa e agora estou relatando isso para você.'
  • 7: indicativo simples: seon-saeng-nim-i jib-e gan-da (선생님 이 집 에 간다) 'O professor está indo para casa. (não expressando respeito ou educação) '
  • 5 e 7: polidez para com o ouvinte: seon-saeng-nim-i jib-e gap-ni-da (선생님 이 집 에 갑니다) ou seon-saeng-nim-i jib-e ga-yo (선생님 이 집 에 가요) 'O professor está indo para casa.',
  • 1 e 7: respeito ao sujeito: seon-saeng-nim-i jib-e ga-sin-da (선생님 이 집 에 가신다) 'O (respeitado) professor está indo para casa.'
  • 1, 5 e 7: dois tipos de polidez em uma frase: seon-saeng-nim-i jib-e ga-syeo-yo (선생님 이 집 에 가셔 요) ou seon-saeng-nim-i jib-e ga- sip-ni-da (선생님 이 집 에 가십 니다) 'O professor está indo para casa. (expressando respeito ao ouvinte e ao professor) '
  • 2, 3 e 7: formas anteriores: Jon-i hak-gyo-e ga-ss-da / gat-ta (존 이 학교 에 갔다) 'John foi para a escola (e está lá agora).', Jon- i hak-gyo-e gass-eoss-da / gass-eot-ta (존 이 학교 에 갔었다) 'John foi à escola (e voltou).'
  • 4 e 7: primeira pessoa modal: nae-ga nae-il ga-gess-da / ga-get-ta (내가 내일 가겠다) 'Eu irei amanhã.'
  • 4 e 7: terceira pessoa modal: Jon-i nae-il ga-gess-da / ga-get-ta (존 이 내일 가겠다) 'Suponho que John irá amanhã.', Jon-i eo-je gass- gess-da / gat-get-ta (존 이 어제 갔 겠다) 'Suponho que John foi embora ontem.'

Sufixo ou prefixo

Embora a maioria das línguas aglutinantes na Europa e na Ásia sejam predominantemente sufixos, as línguas Bantu do sul da África são conhecidas por uma mistura altamente complexa de prefixos, sufixos e reduplicação. Uma característica típica dessa família de línguas é que os substantivos se enquadram em classes de substantivos. Para cada classe de substantivo, existem prefixos específicos no singular e no plural, que também servem como marcadores de concordância entre o sujeito e o verbo. Além disso, o substantivo determina prefixos de todas as palavras que o modificam e o sujeito determina prefixos de outros elementos no mesmo sintagma verbal.

Por exemplo, os substantivos suaíli -toto ("criança") e -tu ("pessoa") se enquadram na classe 1, com prefixo singular m- e prefixo plural wa- . O substantivo -tabu ("livro") cai na classe 7, com prefixo singular ki- e prefixo plural vi- . As seguintes sentenças podem ser formadas:

  • m-toto a-li-fika 'A criança chegou.'
  • m-toto a-ta-fika 'A criança vai chegar.'
  • wa-toto wa-li-fika 'As crianças chegaram.'
  • wa-toto wa-ta-fika 'As crianças chegarão.'
  • m-tu a-li-lala 'A pessoa dormiu.'
  • m-tu a-ta-lala 'A pessoa vai dormir.'
  • wa-tu wa-li-lala 'As pessoas dormiram.'
  • wa-tu wa-ta-lala 'As pessoas dormirão.'
  • ki-tabu ki-li-anguka 'O livro caiu.'
  • ki-tabu ki-ta-anguka 'O livro vai cair.'
  • vi-tabu vi-li-anguka 'Os livros caíram.'
  • vi-tabu vi-ta-anguka 'Os livros cairão.'

yu-le 1sg-that

m-tu 1sg pessoa

m-moja 1sg-one

m-refu 1sg de altura

a-li 1sg-he-past

ye 7sg-rel.-it

ki-soma 7sg-read

ki-le 7sg-that

livro ki-tabu 7sg

ki-refu 7sg-long

"Aquela pessoa alta que leu aquele longo livro."

wa-le 1pl-that

wa-tu 1pl pessoa

wa-wili 1pl-dois

wa-refu 1pl -tall

wa-li 1pl-he-past

(w) -o 7pl-rel.-it

vi-soma 7pl-read

vi-le 7pl-that

vi-tabu 7pl-book

vi-refu 7pl-long

'Aquelas duas pessoas altas que lêem aqueles livros longos.'

No contexto da linguística quantitativa

O linguista americano Joseph Harold Greenberg em seu artigo de 1960 propôs usar o chamado índice aglutinativo para calcular um valor numérico que permitiria a um pesquisador comparar o "grau de aglutitatividade" de várias línguas. Para Greenberg, aglutinação significa que os morfos são unidos apenas com ligeira ou nenhuma modificação. Um morfema é considerado automático se assumir uma única forma de superfície (morfologia) ou se sua forma de superfície for determinada por regras fonológicas válidas em todas as instâncias semelhantes nessa língua. Uma junção de metamorfose - uma posição em uma palavra onde dois morfos se encontram - é considerada aglutinativa quando os dois morfemas incluídos são automáticos. O índice de aglutinação é igual à razão média entre o número de junções aglutinativas e o número de junções morfológicas. Línguas com altos valores de índice aglutinativo são aglutinativas e com baixos valores de índice aglutinativo são fusionais.

No mesmo artigo, Greenberg propôs vários outros índices, muitos dos quais se mostraram relevantes para o estudo da aglutinação. O índice sintético é o número médio de morfemas por palavra, com o menor valor concebível igual a 1 para idiomas isolados (analíticos) e valores da vida real raramente excedendo 3. O índice de composição é igual ao número médio de morfemas de raiz por palavra ( em oposição a morfemas derivacionais e flexionais). Os índices derivacional, flexional, prefixial e sufixial correspondem, respectivamente, ao número médio de morfemas, prefixos e sufixos derivacionais e flexionais.

Aqui está uma tabela de valores de amostra:

aglutinação síntese composição derivação inflexão prefixando sufixo
Suaíli 0,67 2,56 1,00 0,03 0,31 0,45 0,16
falado turco 0,67 1,75 1.04 0,06 0,38 0,00 0,44
escrito turco 0,60 2,33 1,00 0,11 0,43 0,00 0,54
Yakut 0,51 2,17 1.02 0,16 0,38 0,00 0,53
grego 0,40 1,82 1.02 0,07 0,37 0,02 0,42
inglês 0,30 1,67 1,00 0,09 0,32 0,02 0,38
Inuit 0,03 3,70 1,00 0,34 0,47 0,00 0,73

Fonética e aglutinação

A relação um-para-um entre um afixo e sua função gramatical pode ser um tanto complicada pelos processos fonológicos ativos na língua dada. Por exemplo, os dois fenômenos fonológicos a seguir aparecem em muitas das línguas Uralica e Turca :

  • gradação consonantal , significando que há alternância entre certos pares de encontros consonantais de tal forma que um membro do par aparece no início de uma sílaba aberta e o outro no início de uma sílaba fechada ; (em línguas Uralic)
  • assimilação de dessonorização de consoante: processo semelhante, mas diferente de cima, assimilando a dessonorização de uma consoante surda final do radical; (em algumas línguas turcas)
  • harmonia vocálica , o que significa que apenas subclasses específicas de vogais coexistem em uma palavra não composta.

Vários exemplos do finlandês ilustrarão como essas duas regras e outros processos fonológicos levam a desvios da relação básica um-para-um entre os morfos e sua função sintática e semântica. Nenhuma regra fonológica é aplicada na declinação de talo 'casa'. No entanto, o segundo exemplo ilustra vários tipos de fenômenos fonológicos.

Talo
'casa'
märkä paita
'uma camisa molhada'
as raízes contêm consoante aglomerados -rk- e -t-
talo-n
'da casa'
märä-n paida-n
'de uma camisa molhada'
gradação consonantal: o sufixo genitivo -n fecha a sílaba precedente;
          rk -> r, t-> d
talo-ssa
'em casa'
märä-ssä paida-ssa
'de camisa molhada'
harmonia vocálica: uma palavra contendo ä não pode conter as vogais a, o, u ;
          um alomorfo da desinência inessiva -ssa / ssä é usado
talo-i-ssa
'nas casas'
mär-i-ssä paido-i-ssa
'em camisas molhadas'
as regras fonológicas também implicam em mudanças vocálicas diferentes quando o marcador de plural -i- encontra uma vogal radical final

Extremos

É possível construir exemplos artificialmente extremos de aglutinação, que não têm uso real, mas ilustram a capacidade teórica da gramática para aglutinar. Não se trata de "palavras longas", porque algumas línguas permitem combinações ilimitadas com palavras compostas, clíticos negativos ou semelhantes, que podem ser (e são) expressos com uma estrutura analítica em uso real.

O inglês é capaz de aglutinar morfemas de origem exclusivamente nativa ( germânica ), como não-um-todo , mas, de modo geral, as palavras mais longas são reunidas a partir de formas de origem latina ou grega antiga . O exemplo clássico é o antidesestabelecimento . As línguas aglutinativas geralmente têm aglutinação derivacional mais complexa do que as línguas isoladas, de modo que podem fazer o mesmo em uma extensão muito maior. Por exemplo, em húngaro, uma palavra como elnemzetietleníthetetlenségnek , que significa "para [fins de] desnacionalização", pode ter uso real. Da mesma forma, existem as palavras que têm significado, mas provavelmente nunca são usadas como legeslegmegszentségteleníttethetetlenebbjeitekként , que significa "como a maioria dos mais indecifráveis ​​de vocês", mas é difícil de decifrar até mesmo para falantes nativos. Usando aglutinação flexional, eles podem ser estendidos. Por exemplo, o recorde mundial oficial do Guinness é o finlandês epäjärjestelmällistyttämättömyydellänsäkäänköhän "Eu me pergunto se - mesmo com sua qualidade de não ter sido sistematizado". Tem a palavra derivada epäjärjestelmällistyttämättömyys como raiz e é alongada com as desinências flexionais -llänsäkäänköhän . No entanto, esta palavra é gramaticalmente incomum, porque -kään "também" é usado apenas em orações negativas, mas -kö (questão) apenas em orações questionáveis.

Uma aglutinação turca muito popular é Çekoslovakyalılaştıramadıklarımızdanmışsınız , que significa "Você é um daqueles que não fomos capazes de converter em tchecoslovacos". Essa referência histórica é usada como uma piada para os indivíduos que são difíceis de mudar ou que se destacam em um grupo.

Por outro lado, Afyonkarahisarlılaştırabildiklerimizdenmişsinizcesine é uma palavra mais longa que não surpreende as pessoas e significa "Como se você fosse um daqueles que conseguimos fazer parecer pessoas de Afyonkarahisar ". Uma adição recente às reivindicações veio com a introdução da seguinte palavra em turco muvaffakiyetsizleştiricileştiriveremeyebileceklerimizdenmişsinizcesine , que significa algo como "(você está falando) como se você fosse um daqueles que não fomos capazes de transformar em um criador de pessoas malsucedidas" ( alguém que deseduca as pessoas para torná-las malsucedidas).

O georgiano também é uma língua altamente aglutinante. Por exemplo, a palavra gadmosakontrrevolucieleblebisnairebisatvisaco ( გადმოსაკონტრრევოლუციელებლებისნაირებისათვისაცო ) significaria "(alguém não especificado) disse que é também para aqueles que são como aqueles que precisam ser contra-revolucionados de novo / voltar".

Aristófanes comédia " As Mulheres na Assembleia inclui a palavra grega λοπαδο-τεμαχο-σελαχο-γαλεο-κρανιο-λειψανο-δριμ-υπο-τριμματο-σιλφιο-καραβο-μελιτο-κατακεχυ-μενο-κιχλ-επι-κοσσυφο-φαττο-περιστερ-αλεκτρυον-οπτο-κεφαλλιο-κιγκλο-πελειο-λαγῳο-σιραιο-βαφη-τραγανο-πτερύγων , um prato fictícia chamada com uma palavra que enumera seus ingredientes. Ele foi criado para ridicularizar a tendência de compostos longos no grego ático da época.

As línguas eslavas não são consideradas aglutinantes, mas fusionais . No entanto, existem derivações extremas semelhantes às encontradas em linguagens aglutinativas típicas. Um exemplo famoso é a palavra búlgara непротивоконституциослователствувайте , que significa não falar contra a constituição e secundariamente não agir contra a constituição . É composto de apenas três raízes: против contra , конституция constituição , uma palavra de empréstimo e, portanto, desprovida de sua composição interna e palavra слово . Os restantes são morfemas ligados para negação ( не , um proclítico, caso contrário escrito separadamente em verbos), intensificador de substantivo ( -ателств ), conversão substantivo para verbo ( -ува ), modo imperativo desinência de segunda pessoa do plural ( -éте ). É bastante incomum, mas encontra algum uso, por exemplo, manchetes de jornais em 13 de julho de 1991, um dia após a atual constituição búlgara ter sido adotada com muitas controvérsias, debates e até escândalos.

Outros usos das palavras aglutinação e aglutinativo

As palavras aglutinação e aglutinativo vêm da palavra latina aglutinare , 'para colar'. Em linguística, essas palavras estão em uso desde 1836, quando Wilhelm von Humboldt publicou postumamente a obra Über die Verschiedenheit des menschlichen Sprachbaues und ihren Einfluß auf die geistige Entwicklung des Menschengeschlechts [lit .: Sobre as diferenças na construção da linguagem humana e sua influência sobre o desenvolvimento mental da humanidade] introduziu a divisão das línguas em isolante , flexional , aglutinativo e incorporador .

Especialmente em alguma literatura mais antiga, aglutinativo às vezes é usado como sinônimo de sintético . Nesse caso, abrange o que chamamos de linguagens aglutinativas e flexionais, e é um antônimo de analítico ou isolante . Além da motivação etimológica clara (afinal, as terminações flexionais também são "coladas" às hastes), esse uso mais geral é justificado pelo fato de que a distinção entre línguas aglutinativas e flexionais não é nítida, como já vimos.

Na segunda metade do século XIX, muitos linguistas acreditavam que há um ciclo natural de evolução da linguagem: palavras funcionais do tipo isolante são coladas em suas palavras principais, de modo que a linguagem se torna aglutinativa; os morfos posteriores se fundem por meio de processos fonológicos, e o que surge é uma linguagem flexional; finalmente, as terminações flexionais são freqüentemente omitidas na fala rápida, a flexão é omitida e a linguagem volta ao tipo isolante.

A seguinte passagem de Lord (1960) demonstra bem toda a gama de significados que a palavra aglutinação pode ter.

( Aglutinação ...) consiste na fusão de dois ou mais termos que ocorrem constantemente como um grupo sintagmático em uma única unidade, que se torna difícil ou impossível de analisar posteriormente.

Aglutinação assume várias formas. Em francês, a soldagem se torna uma fusão completa. Latim hanc horam 'a esta hora' é a unidade adverbial francesa encore . O francês antigo tous jours torna-se toujours e dès jà ('desde agora') déjà ('já'). Em inglês, por outro lado, além de combinações raras como adeus de Deus esteja com você , noz de noz de Gales , janela de wind-eye (ON vindauga ), as unidades que compõem as formas aglutinadas mantêm sua identidade. Palavras como melro e bife são uma chaleira de peixes diferente; eles retêm suas unidades, mas seu significado último não é totalmente dedutível dessas unidades. (...)

Saussure preferiu distinguir entre palavras compostas e combinações verdadeiramente sintetizadas ou aglutinadas.

Linguagens aglutinativas no processamento de linguagem natural

No processamento da linguagem natural , as línguas com morfologia rica apresentam problemas de um tipo bem diferente do que isolar as línguas. No caso das línguas aglutinativas, o principal obstáculo reside no grande número de formas de palavras que podem ser obtidas a partir de uma única raiz. Como já vimos, a geração dessas formas de palavras é um tanto complicada pelos processos fonológicos da língua particular. Embora a relação básica um-para-um entre a forma e a função sintática não seja quebrada em finlandês, a instituição oficial Instituto de Línguas da Finlândia ( Kotus ) lista 51 tipos de declinação para substantivos, adjetivos, pronomes e numerais finlandeses.

Ainda mais problemas ocorrem com o reconhecimento de formas de palavras. Os métodos linguísticos modernos são amplamente baseados na exploração de corpora; no entanto, quando o número de formas de palavras possíveis é grande, qualquer corpus conterá necessariamente apenas uma pequena fração delas. Hajič (2010) afirma que o espaço e o poder do computador são tão baratos hoje em dia que todas as formas de palavras possíveis podem ser geradas de antemão e armazenadas na forma de um léxico listando todas as interpretações possíveis de qualquer forma de palavra dada. (A estrutura de dados do léxico deve ser otimizada para que a busca seja rápida e eficiente.) De acordo com Hajič, é a desambiguação dessas formas de palavras que é difícil (mais ainda para idiomas flexivos onde a ambigüidade é alta do que para aglutinativos línguas).

Outros autores não compartilham da visão de Hajič de que o espaço não é problema e, em vez de listar todas as formas de palavras possíveis em um léxico, a análise da forma de palavras é implementada por módulos que tentam quebrar a forma de superfície em uma sequência de morfemas que ocorrem em uma ordem permissível por o idioma. O problema de tal análise é o grande número de limites de morfemas típicos para linguagens aglutinativas. Uma palavra de um idioma flexional tem apenas uma desinência e, portanto, o número de divisões possíveis de uma palavra na base e a desinência é apenas linear com o comprimento da palavra. Em uma linguagem aglutinativa, onde vários sufixos são concatenados no final da palavra, o número de divisões diferentes que devem ser verificadas quanto à consistência é grande. Esta abordagem foi usada, por exemplo, no desenvolvimento de um sistema para o árabe, onde a aglutinação ocorre quando artigos, preposições e conjunções são unidos com a palavra seguinte e os pronomes são unidos com a palavra anterior. Ver Grefenstette et al. (2005) para mais detalhes.

Veja também

Notas

Referências

Bibliografia

  • Kimmo Koskenniemi & Lingsoft Oy: Finnish Morphological Analyzer , Lingsoft Language Solutions, 1995–2011.
  • Bernard Comrie (editor): The World Major Languages, Oxford University Press, New York - Oxford 1990.
  • Keith Denning, Suzanne Kemmer (ed.): Sobre a linguagem: escritos selecionados de Joseph H. Greenberg , Stanford University Press, 1990. Partes selecionadas estão disponíveis em googlebooks .
  • Victoria Fromkin, Robert Rodman, Nina Hyams: uma introdução à linguagem , Thompson Wadsworth, 2007.
  • Joseph H. Greenberg: Uma abordagem quantitativa para a tipologia morfológica da linguagem , 1960. Disponível através do JSTOR e em Denning et al. (1990), p. 3-25. Há também um bom resumo .
  • Gregory Grefenstette , Nasredine Semmar, Faïza Elkateb-Gara: Modificando um Sistema de Processamento de Linguagem Natural para Línguas Européias para Tratar o Árabe em Processamento de Informação e Aplicações de Recuperação de Informação , Abordagens Computacionais para Línguas Semíticas - Procedimentos de Workshop, Universidade de Michigan 2005, p. 31-38. Disponível em [1] .
  • Jan Hajič: Revivendo a história: os primórdios da tradução automática estatística e idiomas com morfologia rica , IceTAL'10 Proceedings of the 7th international conference on Advances in natural language processing, Springer-Verlag Berlin, Heidelberg, 2010. Resumo disponível em [2] .
  • Helena Lehečková: Úvod do ugrofinistiky, Státní pedagogické nakladatelství, Praha 1983.
  • Robert Lord: Teach Yourself Comparative Linguistics, The English Universities Press Ltd., St Paul's House, Londres 1967 (primeira edição 1966).
  • Hans Christian Luschützky: Uvedení do typologie jazyků , Filozofická fakulta Univerzity Karlovy, Praha 2003.
  • J. Vendryes: Language - A Linguistic Introduction to History, Kegan Paul, Trench, Trubner Co., Ltd., Londres 1925 (traduzido por Paul Radin)

links externos

  • Mwana Simba , uma página da web sobre a gramática suaíli.