Supressão e cancelamento de eco - Echo suppression and cancellation

A supressão e o cancelamento do eco são métodos usados ​​na telefonia para melhorar a qualidade da voz, evitando que o eco seja criado ou removendo-o depois de já estar presente. Além de melhorar a qualidade subjetiva de áudio, a supressão de eco aumenta a capacidade alcançada por meio da supressão de silêncio , evitando que o eco viaje por uma rede de telecomunicações . Os supressores de eco foram desenvolvidos na década de 1950 em resposta ao primeiro uso de satélites para telecomunicações.

Os métodos de supressão e cancelamento de eco são comumente chamados de supressão de eco acústico ( AES ) e cancelamento de eco acústico ( AEC ) e, mais raramente , cancelamento de eco de linha ( LEC ). Em alguns casos, esses termos são mais precisos, pois existem vários tipos e causas de eco com características únicas, incluindo eco acústico (sons de um alto-falante sendo refletidos e gravados por um microfone, que pode variar substancialmente ao longo do tempo) e eco de linha ( impulsos elétricos causados ​​por, por exemplo, acoplamento entre os fios de envio e recebimento, incompatibilidades de impedância, reflexos elétricos, etc., que variam muito menos do que o eco acústico). Na prática, entretanto, as mesmas técnicas são usadas para tratar todos os tipos de eco, portanto, um cancelador de eco acústico pode cancelar o eco de linha, bem como o eco acústico. O AEC, em particular, é comumente usado para se referir a canceladores de eco em geral, independentemente de serem destinados a eco acústico, eco de linha ou ambos.

Embora os supressores e canceladores de eco tenham objetivos semelhantes - impedir que um indivíduo falante ouça o eco de sua própria voz - os métodos que usam são diferentes:

  • Os supressores de eco funcionam detectando um sinal de voz indo em uma direção em um circuito e, em seguida, silenciando ou atenuando o sinal em outra direção. Normalmente, o supressor de eco na outra extremidade do circuito silencia quando detecta voz vinda da extremidade próxima do circuito. Esse silenciamento evita que o alto-falante ouça sua própria voz retornando do outro lado.
  • O cancelamento de eco envolve primeiro o reconhecimento do sinal originalmente transmitido que reaparece, com algum atraso, no sinal transmitido ou recebido. Uma vez que o eco é reconhecido, ele pode ser removido subtraindo-o do sinal transmitido ou recebido. Esta técnica é geralmente implementada digitalmente usando um processador de sinal digital ou software, embora também possa ser implementada em circuitos analógicos.

Os padrões ITU G.168 e P.340 descrevem os requisitos e testes para canceladores de eco em aplicativos digitais e PSTN , respectivamente.

História

Na telefonia , o eco é a cópia refletida da voz de alguém ouvida algum tempo depois. Se o atraso for bastante significativo (mais de algumas centenas de milissegundos), é considerado incômodo. Se o atraso for muito pequeno (10s de milissegundos ou menos), o fenômeno é chamado de tom lateral . Se o atraso for um pouco mais longo, cerca de 50 milissegundos, os humanos não podem ouvir o eco como um som distinto, mas sim um efeito de coro .

Nos primeiros dias das telecomunicações, a supressão de eco era usada para reduzir a natureza questionável dos ecos para usuários humanos. Uma pessoa fala enquanto a outra escuta, e eles falam de um lado para outro. Um supressor de eco tenta determinar qual é a direção principal e permite que o canal siga em frente. No canal reverso, ele coloca a atenuação para bloquear ou suprimir qualquer sinal na suposição de que o sinal é eco. Embora o supressor lide efetivamente com o eco, essa abordagem leva a vários problemas que podem ser frustrantes para ambas as partes de uma chamada.

  • Conversa dupla : É bastante normal em uma conversa que ambas as partes falem ao mesmo tempo, pelo menos brevemente. Como cada supressor de eco detectará a energia de voz proveniente da extremidade oposta do circuito, o efeito normalmente seria que a perda fosse inserida em ambas as direções ao mesmo tempo, bloqueando efetivamente ambas as partes. Para evitar isso, os supressores de eco podem ser configurados para detectar a atividade de voz do alto-falante local e não inserir perda (ou inserir uma perda menor) quando o alto-falante local e remoto estiverem conversando. Isso, é claro, anula temporariamente o efeito primário de ter um supressor de eco.
  • Clipping: Como o supressor de eco está inserindo e removendo perdas alternadamente, frequentemente ocorre um pequeno atraso quando um novo falante começa a falar, o que resulta no corte da primeira sílaba da fala desse falante.
  • Dead-set: Se a parte remota em uma chamada estiver em um ambiente barulhento, o locutor local ouvirá o ruído de fundo enquanto o locutor remoto estiver falando, mas o supressor de eco suprimirá esse ruído de fundo quando o próximo -end orador começa a falar. A súbita ausência de ruído de fundo dá ao usuário quase final a impressão de que a linha caiu.

Em resposta a isso, Bell Labs desenvolveu a teoria do cancelador de eco no início dos anos 1960, que resultou em canceladores de eco de laboratório no final da década de 1960 e canceladores de eco comerciais na década de 1980. Um cancelador de eco funciona gerando uma estimativa do eco do sinal do locutor e subtrai essa estimativa do caminho de retorno. Essa técnica requer um filtro adaptativo para gerar um sinal preciso o suficiente para cancelar efetivamente o eco, onde o eco pode diferir do original devido a vários tipos de degradação ao longo do caminho. Desde a invenção da AT&T Bell Labs, os algoritmos de cancelamento de eco foram aprimorados e aperfeiçoados. Como todos os processos de cancelamento de eco, esses primeiros algoritmos foram projetados para antecipar o sinal que inevitavelmente entraria novamente no caminho de transmissão e o cancelaria.

Avanços rápidos no processamento de sinal digital permitiram que os canceladores de eco fossem menores e mais econômicos. Na década de 1990, os canceladores de eco foram implementados em switches de voz pela primeira vez (no Northern Telecom DMS-250 ), em vez de dispositivos autônomos. A integração do cancelamento de eco diretamente na central significava que os canceladores de eco podiam ser ligados ou desligados com segurança em uma base chamada a chamada, eliminando a necessidade de grupos de troncos separados para chamadas de voz e dados. A tecnologia de telefonia de hoje frequentemente emprega canceladores de eco em dispositivos de comunicação pequenos ou portáteis por meio de um mecanismo de voz de software , que fornece o cancelamento do eco acústico ou do eco residual introduzido por um sistema de gateway PSTN de ponta remota; tais sistemas normalmente cancelam reflexões de eco com até 64 milissegundos de atraso.

Operação

Um cancelador de eco adaptativo para um circuito telefônico. A função de H , o transformador híbrido , é encaminhar a fala de entrada da extremidade x k para o telefone local e encaminhar a fala do telefone para a extremidade oposta. No entanto, o híbrido nunca é perfeito, portanto, sua saída d k contém a fala desejada do telefone local e a fala filtrada da extremidade oposta. O cancelador de eco é o filtro adaptativo f k , que tenta minimizar o sinal de erro ε k filtrando a fala da extremidade distante que chega em uma réplica y k da fala da extremidade distante que vaza através do híbrido. Assim que a adaptação for concluída, o sinal de erro consiste principalmente na fala do telefone local.

O processo de cancelamento de eco funciona da seguinte maneira:

  1. Um sinal de extremidade remota é entregue ao sistema.
  2. O sinal da extremidade remota é reproduzido.
  3. O sinal da extremidade oposta é filtrado e atrasado para se parecer com o sinal da extremidade próxima.
  4. O sinal da extremidade remota filtrado é subtraído do sinal da extremidade próxima.
  5. O sinal resultante representa os sons presentes na sala, excluindo qualquer som direto ou reverberado.

O principal desafio para um cancelador de eco é determinar a natureza da filtragem a ser aplicada ao sinal da extremidade remota de forma que ele se pareça com o sinal da extremidade próxima resultante. O filtro é essencialmente um modelo de alto-falante, microfone e atributos acústicos da sala. Os canceladores de eco devem ser adaptáveis ​​porque as características do alto-falante e do microfone da extremidade próxima geralmente não são conhecidas com antecedência. Os atributos acústicos da sala da extremidade próxima também não são geralmente conhecidos com antecedência e podem mudar (por exemplo, se o microfone for movido em relação ao alto-falante, ou se os indivíduos andarem pela sala causando mudanças nos reflexos acústicos). Ao usar o sinal da extremidade oposta como estímulo, os sistemas modernos usam um filtro adaptativo e podem convergir do fornecimento sem cancelamento para 55 dB de cancelamento em cerca de 200 ms.

Até recentemente, o cancelamento de eco só precisava ser aplicado à largura de banda de voz dos circuitos telefônicos. As chamadas PSTN transmitem frequências entre 300 Hz e 3 kHz, a faixa necessária para a inteligibilidade da fala humana. A videoconferência é uma área em que o áudio de largura de banda total é usado. Nesse caso, produtos especializados são empregados para realizar o cancelamento de eco.

Como a supressão de eco tem limitações conhecidas, em uma situação ideal, apenas o cancelamento de eco será usado. No entanto, isso é insuficiente em muitas aplicações, notadamente telefones por software em redes com longos atrasos e baixo rendimento. Aqui, o cancelamento e a supressão do eco podem funcionar em conjunto para atingir um desempenho aceitável.

Quantificando eco

Eco é medido como perda de retorno de eco (ERL). Esta é a proporção, expressa emdecibéis, do original e seu eco. Valores altos significam que o eco é muito fraco, enquanto valores baixos significam que o eco é muito forte. Negativo indica que o eco é mais forte do que o sinal original, o que, se não for verificado, causaráfeedback de áudio.

O desempenho de um cancelador de eco é medido no aumento de perda de retorno de eco (ERLE), que é a quantidade de perda de sinal adicional aplicada pelo cancelador de eco. A maioria dos canceladores de eco são capazes de aplicar 18 a 35 dB ERLE.

A perda total de sinal do eco (ACOM) é a soma de ERL e ERLE.

Usos atuais

Fontes de eco são encontradas em ambientes cotidianos, como:

  • Sistemas de telefone mãos-livres para automóveis
  • Um telefone padrão ou celular no modo viva-voz
  • Viva-voz autônomo dedicado
  • Sistemas de sala de conferência instalados que usam alto-falantes de teto e microfones na mesa
  • Acoplamento físico onde as vibrações do alto - falante são transferidas para o microfone através da caixa do fone

Em alguns desses casos, o som do alto-falante entra no microfone quase inalterado. As dificuldades em cancelar o eco decorrem da alteração do som original pelo espaço ambiente. Essas mudanças podem incluir certas frequências sendo absorvidas por estofados e reflexo de diferentes frequências em intensidade variável.

A implementação do AEC requer experiência de engenharia e um processador rápido, geralmente na forma de um processador de sinal digital (DSP). Esse custo na capacidade de processamento pode ser caro, no entanto, muitos sistemas embarcados têm um AEC totalmente funcional.

Alto-falantes inteligentes e sistemas interativos de resposta de voz que aceitam voz para entrada usam AEC enquanto os prompts de voz são reproduzidos para evitar que o próprio sistema de reconhecimento de voz reconheça falsamente os prompts ecoados e outras saídas.

Modems

As linhas telefônicas padrão usam o mesmo par de fios para enviar e receber áudio, o que resulta em uma pequena quantidade do sinal de saída sendo refletido de volta. Isso é útil para pessoas que falam ao telefone, pois fornece um sinal ao alto-falante de que sua voz está sendo transmitida pelo sistema. No entanto, esse sinal refletido causa problemas para um modem, que não consegue distinguir entre um sinal do modem remoto e o eco de seu próprio sinal.

Por esse motivo, os modems dial-up anteriores dividiam as frequências do sinal, de modo que os dispositivos em cada extremidade usavam tons diferentes, permitindo que cada um ignorasse quaisquer sinais na faixa de frequência que estava usando para transmissão. No entanto, isso diminuiu a quantidade de largura de banda disponível para ambos os lados.

O cancelamento de eco mitigou esse problema. Durante o estabelecimento da chamada e o período de negociação, ambos os modems enviam uma série de tons exclusivos e, em seguida, ouvem seu retorno através do sistema telefônico. Eles medem o tempo total de atraso e, em seguida, configuram uma linha de atraso para o mesmo período. Assim que a conexão for concluída, eles enviam seus sinais para as linhas telefônicas normalmente, mas também para a linha de atraso. Quando seu sinal é refletido de volta, ele é misturado com o sinal invertido da linha de atraso, que cancela o eco. Isso permitiu que ambos os modems usassem todo o espectro disponível, dobrando a velocidade possível.

O cancelamento de eco também é aplicado por muitas telcos à própria linha e pode causar corrupção de dados em vez de melhorar o sinal. Alguns switches ou conversores de telefone (como adaptadores de terminal analógico) desabilitam a supressão ou cancelamento de eco quando detectam tons de atendimento de 2100 ou 2225 Hz associados a tais chamadas, de acordo com a recomendação G.164 ou G.165 do ITU-T .

Os modems ISDN e DSL operando em frequências acima da banda de voz sobre fios de telefone de par trançado padrão também usam o cancelamento de eco automatizado para permitir a comunicação de dados bidirecional simultânea. A complexidade computacional na implementação do filtro adaptativo é muito reduzida em comparação com o cancelamento do eco de voz porque o sinal de transmissão é um fluxo de bits digital. Em vez de uma multiplicação e uma operação de adição para cada toque no filtro, apenas a adição é necessária. Um esquema de cancelamento de eco baseado em tabela de pesquisa RAM elimina até mesmo a operação de adição, simplesmente endereçando uma memória com um fluxo de bits de transmissão truncado para obter a estimativa de eco. Com os avanços na tecnologia de semicondutores, o cancelamento de eco agora é comumente implementado com técnicas de Processador de Sinal Digital (DSP).

Alguns modems usam frequências de entrada e saída separadas ou alocam slots de tempo separados para transmissão e recepção para eliminar a necessidade de cancelamento de eco. Freqüências mais altas além dos limites do projeto original dos cabos telefônicos sofrem distorção de atenuação significativa devido aos taps da ponte e ao casamento de impedância incompleto . Freqüentemente, ocorrem lacunas de frequência estreitas e profundas que não podem ser corrigidas pelo cancelamento do eco. Eles são detectados e mapeados durante a negociação da conexão.

Veja também

Referências

links externos