MPEG Surround - MPEG Surround

MPEG Surround ( ISO / IEC 23003-1 ou MPEG-D Parte 1), também conhecido como Spatial Audio Coding (SAC) é um formato de compressão com perdas para som surround que fornece um método para estender serviços de áudio mono ou estéreo para áudio multicanal de uma forma compatível com versões anteriores. As taxas de bits totais usadas para o núcleo (mono ou estéreo) e os dados MPEG Surround são normalmente apenas um pouco mais altas do que as taxas de bits usadas para a codificação do núcleo (mono ou estéreo). MPEG Surround adiciona um fluxo de informações secundárias ao fluxo de bits principal (mono ou estéreo) , contendo dados de imagem espacial. Os sistemas de reprodução estéreo legados ignorarão essas informações secundárias, enquanto os reprodutores que suportam decodificação MPEG Surround emitirão o áudio multicanal reconstruído.

O Moving Picture Experts Group (MPEG) lançou uma chamada de propostas sobre codificação de áudio espacial MPEG em março de 2004. O grupo decidiu que a tecnologia que seria o ponto de partida no processo de padronização seria uma combinação das submissões de dois proponentes - Fraunhofer IIS / Agere Systems and Coding Technologies / Philips. O padrão MPEG Surround foi desenvolvido pelo Moving Picture Experts Group ( ISO / IEC JTC1 / SC29 / WG11) e publicado como ISO / IEC 23003 em 2007. Foi o primeiro padrão do grupo de padrões MPEG-D, formalmente conhecido como ISO / IEC 23003 - Tecnologias de áudio MPEG .

O MPEG Surround também foi definido como um dos tipos de objeto de áudio MPEG-4 em 2007. Há também o tipo de objeto MPEG Surround MPEG-4 sem atraso (LD MPEG Surround), que foi publicado em 2010. The Spatial Audio Object Coding (SAOC ) foi publicado como MPEG-D Parte 2 - ISO / IEC 23003-2 em 2010 e estende o padrão MPEG Surround reutilizando seus recursos de renderização espacial, mantendo a compatibilidade total com os receptores existentes. O sistema MPEG SAOC permite que os usuários no lado da decodificação controlem interativamente a renderização de cada objeto de áudio individual (por exemplo, instrumentos individuais, vocais, vozes humanas). Há também a Codificação de Áudio e Fala Unificada (USAC) que será definida no MPEG-D Parte 3 - ISO / IEC 23003-3 e ISO / IEC 14496-3: 2009 / Amd 3. Ferramentas de codificação paramétrica MPEG-D MPEG Surround são integrados ao codec USAC.

O núcleo (mono ou estéreo) pode ser codificado com qualquer codec de áudio ( com ou sem perdas ) . Taxas de bits particularmente baixas (64-96 kbit / s para 5.1 canais) são possíveis ao usar HE-AAC v2 como codec principal.

Percepção de sons no espaço

A codificação MPEG Surround usa nossa capacidade de perceber o som em 3D e captura essa percepção em um conjunto compacto de parâmetros. A percepção espacial é atribuída principalmente a três parâmetros, ou pistas, que descrevem como os humanos localizam o som no plano horizontal: diferença de nível interaural (ILD), diferença de tempo interaural (ITD) e coerência interaural (IC). Esses três conceitos são ilustrados na próxima imagem. As formas de onda diretas ou de primeira chegada da fonte atingem o ouvido esquerdo no momento, enquanto o som direto recebido pelo ouvido direito é difratado ao redor da cabeça, com atraso de tempo e atenuação de nível, associados. Esses dois efeitos resultam em ITD e ILD estão associados à fonte principal. Por fim, em um ambiente reverberante, o som refletido da fonte, ou som de fonte difusa, ou som não correlacionado pode atingir ambos os ouvidos, todos eles relacionados com o IC. Figura 1.  Ilustração de ILD, ITD e IC

Descrição

MPEG Surround usa diferenças entre canais em nível, fase e coerência equivalentes aos parâmetros ILD, ITD e IC. A imagem espacial é capturada por um sinal de áudio multicanal em relação a um sinal de downmix transmitido. Esses parâmetros são codificados de uma forma muito compacta para decodificar os parâmetros e o sinal transmitido e para sintetizar uma representação multicanal de alta qualidade.

Princípios da codificação MPEG Surround

MPEG surround codificador recebe um sinal de áudio de canais múltiplos x1 a xN, onde o número de canais de entrada é N . O aspecto mais importante do processo de codificação é que um sinal de downmix, xt1 e xt2, que normalmente é estéreo, é derivado do sinal de entrada multicanal, e é esse sinal de downmix que é comprimido para transmissão pelo canal em vez do sinal multicanal . O codificador pode ser capaz de explorar o processo de downmix para ser mais vantajoso. Ele não apenas cria um equivalente fiel do sinal multicanal no downmix mono ou estéreo, mas também cria a melhor decodificação multicanal possível com base no downmix e também nas pistas espaciais codificadas. Alternativamente, o downmix pode ser fornecido externamente (Downmix artístico antes do Bloco do Diagrama). O processo de codificação MPEG Surround pode ser ignorado pelo algoritmo de compressão usado para os canais transmitidos (Codificador de Áudio e Decodificador de Áudio antes do Bloco de Diagrama). Pode ser qualquer tipo de algoritmo de compressão de alto desempenho, como MPEG-1 Layer III, MPEG-4 AAC ou MPEG-4 High Efficiency AAC, ou pode até ser PCM.

Compatibilidade legada

A técnica MPEG Surround permite a compatibilidade com decodificadores MPEG estéreo existentes e futuros, fazendo com que o downmix transmitido (por exemplo, estéreo) pareça aos decodificadores MPEG estéreo uma versão estéreo comum do sinal multicanal. A compatibilidade com decodificadores estéreo é desejável, já que a apresentação estéreo permanecerá difusa devido ao número de aplicativos em que a audição é feita principalmente por meio de fones de ouvido, como reprodutores de música portáteis.

MPEG Surround também suporta um modo no qual o downmix é compatível com decodificadores de matriz surround populares, como Dolby Pro-Logic .

Formulários

Transmissão de áudio digital

Devido à largura de banda do canal relativamente pequena, ao custo relativamente alto do equipamento de transmissão e das licenças de transmissão e ao desejo de maximizar as opções do usuário fornecendo muitos programas, a maioria dos sistemas de transmissão digital existentes ou planejados não podem fornecer som multicanal aos usuários.

O DRM + foi projetado para ser totalmente capaz de transmitir MPEG Surround e essa transmissão também foi demonstrada com sucesso.

A compatibilidade com versões anteriores do MPEG Surround e a sobrecarga relativamente baixa fornecem uma maneira de adicionar som multicanal ao DAB sem reduzir drasticamente a qualidade do áudio ou impactar outros serviços.

Transmissão de TV digital

Atualmente, a maioria das transmissões de TV digital usa codificação de áudio estéreo. O MPEG Surround pode ser usado para estender esses serviços estabelecidos ao som surround, como acontece com o DAB.

Serviço de download de música

Atualmente, vários serviços comerciais de download de música estão disponíveis e funcionam com considerável sucesso comercial. Esses serviços podem ser estendidos sem problemas para fornecer apresentações multicanal enquanto permanecem compatíveis com reprodutores estéreo: em computadores com sistemas de reprodução de 5.1 canais, os arquivos de som compactados são apresentados em som surround, enquanto em reprodutores portáteis os mesmos arquivos são reproduzidos em estéreo.

Serviço de streaming de música / rádio na Internet

Muitos rádios de Internet operam com largura de banda de transmissão severamente restrita, de modo que podem oferecer apenas conteúdo mono ou estéreo. A tecnologia de codificação MPEG Surround pode estender isso a um serviço multicanal, enquanto ainda permanece dentro da faixa de operação permitida de taxas de bits. Visto que a eficiência é de suma importância nesta aplicação, a compressão do sinal de áudio transmitido é vital. Usando a recente tecnologia de compressão MPEG (codificação MPEG-4 High Efficiency Profile), os sistemas MPEG Surround completos foram demonstrados com taxas de bits tão baixas quanto 48 kbit / s.

Veja também

Referências

links externos