Formant - Formant

Espectrograma de vogais do inglês americano [i, u, ɑ] mostrando os formantes F 1 e F 2

Na ciência da fala e na fonética , um formante é o amplo espectro máximo que resulta de uma ressonância acústica do trato vocal humano. Em acústica , um formante é geralmente definido como um pico amplo, ou máximo local, no espectro. Para sons harmônicos, com esta definição, a frequência do formante é às vezes considerada como a do harmônicoparcial que é mais aumentada por uma ressonância. A diferença entre essas duas definições reside em se os "formantes" caracterizam os mecanismos de produção de um som ou o próprio som produzido. Na prática, a frequência de um pico espectral difere da frequência de ressonância associada, exceto quando, por sorte, os harmônicos estão alinhados com a frequência de ressonância.

Pode-se dizer que uma sala tem formantes característicos daquela sala em particular, devido à maneira como o som é refletido em suas paredes e objetos. Formantes de sala dessa natureza se reforçam enfatizando frequências específicas e absorvendo outras, como explorado, por exemplo, por Alvin Lucier em seu artigo I Am Sitting in a Room .

História

Do ponto de vista acústico, a fonética tinha um sério problema com a ideia de que o comprimento efetivo do trato vocal mudava as vogais. De fato, quando o comprimento do trato vocal muda, todos os ressonadores acústicos formados pelas cavidades bucais são dimensionados, assim como suas frequências de ressonância. Portanto, não estava claro como as vogais poderiam depender das frequências quando falantes com diferentes comprimentos de trato vocal, por exemplo , cantores de baixo e soprano , podem produzir sons que são percebidos como pertencentes à mesma categoria fonética. Tinha que haver alguma maneira de normalizar a informação espectral subjacente à identidade vocálica. Hermann sugeriu uma solução para este problema em 1894, cunhando o termo “formante”. A vogal, segundo ele, é um fenômeno acústico especial, dependendo da produção intermitente de uma parcial especial, ou “formante”, ou “caracteristica”. A frequência do “formante” pode variar um pouco sem alterar o caráter da vogal. Para um , por exemplo, o “formante” pode variar de 350 a 440 Hz, mesmo na mesma pessoa.

Fonética

Formantes vocálicos médios para uma voz masculina
Vogal
( IPA )
Formant F 1
(Hz)
Formant F 2
(Hz)
Diferença
F 1 - F 2
(Hz)
eu 240 2.400 2160
y 235 2100 1865
e 390 2300 1910
ø 370 1900 1530
ɛ 610 1900 1290
œ 585 1710 11: 25h
uma 850 1610 760
ɶ 820 1530 710
ɑ 750 940 190
ɒ 700 760 60
ʌ 600 1170 570
ɔ 500 700 200
ɤ 460 1310 850
o 360 640 280
ɯ 300 1390 1090
você 250 595 345
Formantes vocálicos médios em um diagrama

Formantes são componentes de frequência distintos do sinal acústico produzido pela fala, instrumentos musicais ou canto . As informações de que os humanos precisam para distinguir entre os sons da fala podem ser representadas de forma puramente quantitativa, especificando-se picos no espectro de amplitude ou frequência. A maioria desses formantes é produzida por ressonância de tubo e câmara , mas alguns tons de apito derivam do colapso periódico das zonas de baixa pressão do efeito Venturi . O formante com a frequência mais baixa é denominado F 1 , o segundo F 2 e o terceiro F 3 . (A frequência fundamental ou tom da voz é algumas vezes referido como F 0 , mas não é um formante.) Na maioria das vezes, os dois primeiros formantes, F 1 e F 2 , são suficientes para identificar a vogal. A relação entre a qualidade da vogal percebida e as duas primeiras frequências de formantes pode ser apreciada ouvindo "vogais artificiais" que são geradas passando um trem de clique (para simular o trem de pulso glótico) através de um par de filtros passa-banda (para simular o trato vocal ressonâncias).

As consoantes nasais geralmente têm um formante adicional em torno de 2500 Hz. O líquido [l] geralmente tem um formante extra em 1500 Hz, enquanto o som inglês "r" ( [ɹ] ) é distinguido por um terceiro formante muito baixo (bem abaixo de 2000 Hz).

Plosivas (e, em certo grau, fricativas ) modificam a colocação de formantes nas vogais circundantes. Sons bilabiais (como / b / e / p / em "bola" ou "seiva") causam um abaixamento dos formantes; sons velar ( / k / e / ɡ / em inglês) quase sempre mostram F 2 e F 3 se unindo em uma 'pinça velar' antes do velar e se separando da mesma 'pinça' quando o velar é liberado; sons alveolares ( / t / e / d / do inglês ) causam menos mudanças sistemáticas nos formantes vocálicos vizinhos, dependendo parcialmente de exatamente qual vogal está presente. O curso de tempo dessas mudanças nas frequências dos formantes das vogais é conhecido como 'transições dos formantes'.

A frequência fundamental da vibração subjacente é uma onda dente de serra , rica em sobretons harmônicos . Se a frequência fundamental ou (mais frequentemente) um dos sobretons for maior do que uma frequência de ressonância do sistema, então o formante normalmente transmitido por aquela ressonância será quase todo perdido. Isso é mais evidente no caso de cantores de ópera soprano , que cantam alto o suficiente para que suas vogais se tornem muito difíceis de distinguir.

O controle das ressonâncias é um componente essencial da técnica vocal conhecida como canto harmônico , em que o executante canta um tom fundamental baixo e cria ressonâncias agudas para selecionar harmônicos superiores , dando a impressão de vários tons sendo cantados ao mesmo tempo.

Os espectrogramas podem ser usados ​​para visualizar formantes. Em espectrogramas, pode ser difícil distinguir formantes de harmônicos que ocorrem naturalmente quando alguém canta. No entanto, pode-se ouvir os formantes naturais em forma de vogal por meio de técnicas atonais, como o som vocal .

Estimativa de Formant

Formantes, sejam eles vistos como ressonâncias acústicas do trato vocal, ou como máximos locais no espectro da fala, como filtros passa-banda , são definidos por sua frequência e por sua largura espectral.

Existem diferentes métodos para obter essas informações. As frequências dos formantes, em sua definição acústica, podem ser estimadas a partir do espectro de frequência do som, usando um espectrograma (na figura) ou um analisador de espectro. No entanto, para estimar as ressonâncias acústicas do trato vocal (ou seja, a definição de formantes da fala) a partir de uma gravação de fala, pode-se usar a codificação preditiva linear . Uma abordagem intermediária consiste em extrair o envelope espectral neutralizando a frequência fundamental, e só então buscar os máximos locais no envelope espectral.

Parcelas de Formantes

Os dois primeiros formantes são importantes para determinar a qualidade das vogais e são freqüentemente ditos como correspondendo às dimensões aberta / fechada e frontal / posterior (que tradicionalmente, embora não totalmente com precisão, tenham sido associadas à forma e posição da língua ) . Assim, o primeiro formante F 1 tem uma frequência mais alta para uma vogal aberta (como [a] ) e uma frequência mais baixa para uma vogal fechada (como [i] ou [u] ); e o segundo formante F 2 tem uma frequência mais alta para uma vogal anterior (como [i] ) e uma frequência mais baixa para uma vogal posterior (como [u] ). como pode ser visto na Fig. 1.

Fig. 1 Diagrama esquemático do gráfico do formante

As vogais quase sempre terão quatro ou mais formantes distinguíveis; às vezes, são mais de seis. No entanto, os dois primeiros formantes são mais importantes na determinação da qualidade da vogal, e isso é frequentemente exibido em termos de um gráfico do primeiro formante contra o segundo formante, embora isso não seja suficiente para capturar alguns aspectos da qualidade da vogal, como arredondamento. Um exemplo de como as vogais de uma língua ou dialeto podem ser plotadas em um gráfico de vogais auditivos tradicionais e também em um gráfico de formantes pode ser visto no caso do norueguês .

Enquanto as tentativas de Daniel Jones em capturar a articulação vocálica resultaram na Associação Fonética Internacional traçando vogais em um trapézio, o espaço do formante real pode ser mais triangular. É mostrado um enredo idealizado dos formantes de Jones e John Wells pronunciando as vogais cardeais do IPA.

Muitos escritores abordaram o problema de encontrar um alinhamento ideal das posições das vogais nos gráficos dos formantes com aquelas no quadrilátero vocálico convencional. O trabalho pioneiro de Ladefoged usou a escala Mel porque esta escala foi reivindicada para corresponder mais de perto à escala auditiva de altura do que à medida acústica da frequência fundamental expressa em Hertz como na Fig. 1. Duas alternativas para a escala Mel são a Bark escala e a escala de taxa ERB . Uma comparação dessas três escalas é mostrada por Hayward, p. 141, e gráficos de formantes baseados na escala Hertz e na escala Bark são comparados na p. 153. Outra estratégia para melhorar os gráficos de formantes que tem sido amplamente adotada é plotar no eixo horizontal não o valor de F2, mas a diferença entre F1 e F2 para uma determinada vogal.

Formante do cantor

Estudos do espectro de frequência de cantores clássicos treinados , especialmente cantores do sexo masculino, indicam um formante claro em torno de 3000 Hz (entre 2800 e 3400 Hz) que está ausente na fala ou no espectro de cantores não treinados. Acredita-se que esteja associado a uma ou mais ressonâncias mais altas do trato vocal. É esse aumento de energia em 3000 Hz que permite que os cantores sejam ouvidos e compreendidos por uma orquestra . Este formante é desenvolvido ativamente por meio do treinamento vocal , por exemplo, através dos chamados exercícios de voce di strega ou "voz de bruxa" e é causado por uma parte do trato vocal que atua como um ressonador . Na música clássica e na pedagogia vocal, esse fenômeno também é conhecido como squillo .

Veja também

Referências

links externos