Subamostragem de croma - Chroma subsampling

A subamostragem de croma é a prática de codificar imagens implementando menos resolução para informações de croma do que para informações de luma , aproveitando a menor acuidade do sistema visual humano para diferenças de cor do que para luminância.

É usado em muitos esquemas de codificação de vídeo - analógico e digital - e também na codificação JPEG .

Justificativa

Em tamanho real , esta imagem mostra a diferença entre quatro esquemas de subamostragem. Observe como as imagens coloridas parecem semelhantes. A linha inferior mostra a resolução das informações de cor.

Os sinais digitais são freqüentemente comprimidos para reduzir o tamanho do arquivo e economizar tempo de transmissão. Como o sistema visual humano é muito mais sensível às variações de brilho do que à cor, um sistema de vídeo pode ser otimizado dedicando mais largura de banda ao componente luma (geralmente denominado Y ') do que aos componentes de diferença de cor Cb e Cr. Em imagens compactadas, por exemplo, o esquema 4: 2: 2 Y'CbCr requer dois terços da largura de banda de "4: 4: 4" R'G'B ' não subamostrado . Essa redução resulta em quase nenhuma diferença visual percebida pelo espectador.

Como funciona a subamostragem

Em distâncias de visualização normais, não há perda perceptível decorrente da amostragem dos detalhes de cor em uma taxa mais baixa, ou seja, com uma resolução mais baixa. Em sistemas de vídeo, isso é obtido por meio do uso de componentes de diferença de cor. O sinal é dividido em um componente luma (Y ') e dois componentes de diferença de cor ( croma ). Uma variedade de métodos de filtragem pode ser usada para chegar aos valores de croma de resolução reduzida.

Luma (Y ') é diferenciado da luminância (Y) pela presença de correção gama em seu cálculo, daí o símbolo principal adicionado aqui. Um sinal com correção de gama tem a vantagem de emular a sensibilidade logarítmica da visão humana, com mais níveis dedicados aos níveis mais escuros do que aos mais claros. Como resultado, é ubiquamente utilizado na fonte de tristimulus sinal, o R'G'B' de entrada. Exemplos de tais espaços de cores incluem sRGB , TV Rec. 601 , Rec. 709 e Rec. 2020 ; o conceito também é generalizado para funções de transferência óptica em Rec. 2020 .

Sistemas de amostragem e taxas

O esquema de subamostragem é comumente expresso como uma razão de três partes J : a : b (por exemplo, 4: 2: 2) ou quatro partes, se o canal alfa estiver presente (por exemplo, 4: 2: 2: 4), que descrevem o número de amostras de luminância e crominância em uma região conceitual com J pixels de largura e 2 pixels de altura. As peças são (em sua respectiva ordem):

  • J : referência de amostragem horizontal (largura da região conceitual). Normalmente, 4.
  • a : número de amostras de crominância (Cr, Cb) na primeira linha de J pixels.
  • b : número de mudanças de amostras de crominância (Cr, Cb) entre a primeira e a segunda linha de J pixels. Observe que b deve ser zero ou igual a a (exceto em casos raros e irregulares como 4: 4: 1 e 4: 2: 1, que não seguem esta convenção).
  • Alfa : fator horizontal (relativo ao primeiro dígito). Pode ser omitido se o componente alfa não estiver presente e é igual a J quando presente.

Esta notação não é válida para todas as combinações e tem exceções, por exemplo, 4: 1: 0 (onde a altura da região não é 2 pixels, mas 4 pixels, então se 8 bits por componente forem usados, a mídia será 9 bits por pixel) e 4: 2: 1.


4: 1: 1 4: 2: 0 4: 2: 2 4: 4: 4 4: 4: 0
Y'CrCb  
 
= = = = =
Y '  
 
+ + + + +
1 2 3 4  J = 4 1 2 3 4  J = 4 1 2 3 4  J = 4 1 2 3 4  J = 4 1 2 3 4  J = 4
(Cr, Cb) 1 a = 1 1 2 a = 2 1 2 a = 2 1 2 3 4 a = 4 1 2 3 4 a = 4
1 b = 1 b = 0 1 2 b = 2 1 2 3 4 b = 4 b = 0
¼ resolução horizontal,
resolução vertical total
½ resolução horizontal,
½ resolução vertical
½ resolução horizontal,
resolução vertical completa
resolução horizontal total,
resolução vertical total
resolução horizontal completa,
½ resolução vertical

Os exemplos de mapeamento dados são apenas teóricos e ilustrativos. Observe também que o diagrama não indica nenhuma filtragem de croma, que deve ser aplicada para evitar aliasing .

Para calcular o fator de largura de banda necessário relativo a 4: 4: 4 (ou 4: 4: 4: 4), é necessário somar todos os fatores e dividir o resultado por 12 (ou 16, se alfa estiver presente).

Tipos de amostragem e subamostragem

4: 4: 4

Cada um dos três componentes Y'CbCr tem a mesma taxa de amostragem, portanto, não há subamostragem de croma. Esse esquema às vezes é usado em scanners de filmes de última geração e na pós-produção cinematográfica.

Observe que "4: 4: 4" pode, em vez disso, estar se referindo incorretamente ao espaço de cores R'G'B ' , que implicitamente também não tem subamostragem de croma (exceto em JPEG R'G'B' pode ser subamostrado). Formatos como HDCAM SR podem gravar 4: 4: 4 R'G'B 'em dual-link HD-SDI .

4: 2: 2

Os dois componentes de croma são amostrados na metade da taxa de amostragem horizontal de luma: a resolução de croma horizontal é reduzida à metade. Isso reduz a largura de banda de um sinal de vídeo não compactado em um terço.

Muitos formatos e interfaces de vídeo digital de alta tecnologia usam este esquema:

4: 2: 1

Este modo de amostragem não pode ser expresso na notação J: a: b. "4: 2: 1" é um termo obsoleto de um esquema de notação anterior e muito poucos codecs de software ou hardware o usam. A resolução horizontal de Cb é a metade daquela de Cr (e um quarto da resolução horizontal de Y ).

4: 1: 1

Na subamostragem de croma 4: 1: 1, a resolução de cor horizontal é dividida em quartos e a largura de banda é reduzida à metade em comparação com nenhuma subamostragem de croma. Inicialmente, a subamostragem de croma 4: 1: 1 do formato DV não era considerada qualidade de transmissão e só era aceitável para aplicações de consumidor e low-end. No entanto, os formatos baseados em DV (alguns dos quais usam subamostragem de croma 4: 1: 1) têm sido usados ​​profissionalmente na coleta de notícias eletrônicas e em servidores de playout. O DV também foi usado esporadicamente em longas-metragens e na cinematografia digital .

No sistema NTSC, se o luma for amostrado a 13,5 MHz, isso significa que os sinais Cr e Cb serão amostrados cada um a 3,375 MHz, o que corresponde a uma largura de banda máxima de Nyquist de 1,6875 MHz, enquanto o tradicional "high-end broadcast analógico O codificador NTSC "teria uma largura de banda Nyquist de 1,5 MHz e 0,5 MHz para os canais I / Q. No entanto, na maioria dos equipamentos, especialmente aparelhos de TV baratos e VCRs VHS / Betamax, os canais de croma têm apenas a largura de banda de 0,5 MHz para Cr e Cb (ou equivalente para I / Q). Portanto, o sistema DV fornece, na verdade, uma largura de banda de cor superior em comparação com as melhores especificações analógicas compostas para NTSC, apesar de ter apenas 1/4 da largura de banda de croma de um sinal digital "completo".

Os formatos que usam subamostragem de croma 4: 1: 1 incluem:

4: 2: 0

Em 4: 2: 0, a amostragem horizontal é duplicada em comparação com 4: 1: 1, mas como os canais Cb e Cr são amostrados apenas em cada linha alternativa neste esquema, a resolução vertical é reduzida à metade. A taxa de dados é, portanto, a mesma. Isso se encaixa razoavelmente bem com o sistema de codificação de cores PAL , uma vez que possui apenas metade da resolução de crominância vertical do NTSC . Também se encaixaria extremamente bem com o sistema de codificação de cores SECAM , uma vez que, como esse formato, 4: 2: 0 apenas armazena e transmite um canal de cor por linha (o outro canal sendo recuperado da linha anterior). No entanto, pouco equipamento foi realmente produzido que produza um sinal de vídeo analógico SECAM. Em geral, os territórios SECAM precisam usar um monitor compatível com PAL ou um transcodificador para converter o sinal PAL em SECAM para exibição.

Diferentes variantes de configurações de croma 4: 2: 0 são encontradas em:

Cb e Cr são, cada um, subamostrados a um fator de 2 tanto horizontal quanto verticalmente.

Existem três variantes de esquemas 4: 2: 0, tendo diferentes localizações horizontais e verticais.

  • No MPEG-2, MPEG-4 e AVC Cb e Cr são colocados horizontalmente. Cb e Cr estão localizados entre os pixels na direção vertical (localizados intersticialmente).
  • Em JPEG / JFIF, H.261 e MPEG-1, Cb e Cr estão localizados intersticialmente, a meio caminho entre as amostras alternadas de luma.
  • Em 4: 2: 0 DV, Cb e Cr são co-localizados na direção horizontal. Na direção vertical, eles são co-localizados em linhas alternadas. Isso também é o que é usado em HEVC em conteúdo BT.2020 e BT.2100 (em particular em Blu-rays). Também chamado de canto superior esquerdo.

A maioria dos formatos de vídeo digital correspondentes a PAL usa subamostragem de croma 4: 2: 0, com exceção de DVCPRO25, que usa subamostragem de croma 4: 1: 1. Ambos os esquemas 4: 1: 1 e 4: 2: 0 reduzem pela metade a largura de banda em comparação com nenhuma subamostragem de croma.

Com material entrelaçado , a subamostragem de croma 4: 2: 0 pode resultar em artefatos de movimento se for implementada da mesma forma que para material progressivo. As amostras de luma são derivadas de intervalos de tempo separados, enquanto as amostras de croma seriam derivadas de ambos os intervalos de tempo. É essa diferença que pode resultar em artefatos de movimento. O padrão MPEG-2 permite um esquema alternativo de amostragem entrelaçado, onde 4: 2: 0 é aplicado a cada campo (não ambos os campos ao mesmo tempo). Isso resolve o problema de artefatos de movimento, reduz a resolução de croma vertical pela metade e pode introduzir artefatos semelhantes a pente na imagem.

444-original-single-field.png
Original. Esta imagem mostra um único campo. O texto em movimento tem algum desfoque de movimento aplicado a ele.

420-progressivo-único-campo.png
Amostragem progressiva 4: 2: 0 aplicada ao material entrelaçado em movimento . Observe que o croma conduz e segue o texto em movimento. Esta imagem mostra um único campo.

420-interlaced-single-field.png
Amostragem entrelaçada 4: 2: 0 aplicada ao material entrelaçado em movimento . Esta imagem mostra um único campo.

No esquema entrelaçado de 4: 2: 0, no entanto, a resolução vertical do croma é aproximadamente reduzida à metade, uma vez que as amostras de croma descrevem efetivamente uma área de 2 amostras de largura por 4 amostras de altura em vez de 2 × 2. Da mesma forma, o deslocamento espacial entre os dois campos pode resultar no aparecimento de artefatos cromáticos semelhantes a pente.

420-original444.png
Imagem estática original.

420-progressivo-still.png
Amostragem progressiva 4: 2: 0 aplicada a uma imagem fixa. Ambos os campos são mostrados.

420-interlaced-still.png
Amostragem entrelaçada 4: 2: 0 aplicada a uma imagem estática. Ambos os campos são mostrados.

Se o material entrelaçado tiver que ser desentrelaçado, os artefatos de croma tipo pente (da amostragem entrelaçada 4: 2: 0) podem ser removidos desfocando o croma verticalmente.

4: 1: 0

Essa proporção é possível e alguns codecs a suportam, mas não é amplamente usada. Essa proporção usa metade das resoluções de cores verticais e um quarto da horizontal, com apenas um oitavo da largura de banda das resoluções de cores máximas usadas. O vídeo não compactado neste formato com quantização de 8 bits usa 10 bytes para cada macropixel (que é 4 × 2 pixels). Ele tem a largura de banda de crominância equivalente a um sinal PAL I decodificado com um decodificador de linha de atraso, e ainda muito superior ao NTSC.

  • Alguns codecs de vídeo podem operar em 4: 1: 0,5 ou 4: 1: 0,25 como uma opção, de modo a permitir uma qualidade semelhante à de VHS.

3: 1: 1

Usado pela Sony em seus gravadores de alta definição HDCAM (não HDCAM SR). Na dimensão horizontal, luma é amostrado horizontalmente em três quartos da taxa de amostragem full HD - 1440 amostras por linha em vez de 1920. Chroma é amostrado em 480 amostras por linha, um terço da taxa de amostragem luma.

Na dimensão vertical, tanto luma quanto croma são amostrados na taxa de amostragem full HD (1080 amostras verticalmente).

Artefatos

Imagem original sem subamostragem de cores. Zoom de 200%.
Imagem após subamostragem de cor (codec Sony Vegas DV, filtragem de caixa).
Observe o sangramento de leveza perto das fronteiras.

A subamostragem de croma sofre de dois tipos principais de artefatos, causando degradação mais perceptível do que o pretendido, quando as cores mudam abruptamente.

Erro de gama

Sinais com correção de gama, como Y'CbCr, têm problemas em que os erros de croma "vazam" para o luma. Nesses sinais, um croma baixo realmente faz com que uma cor pareça menos brilhante do que uma com luma equivalente. Como resultado, quando uma cor saturada se mistura com uma cor não saturada ou complementar, ocorre uma perda de luminância na borda. Isso pode ser visto no exemplo entre magenta e verde. Para chegar a um conjunto de valores subamostrados que se assemelham mais ao original, é necessário desfazer a correção de gama, realizar o cálculo e, em seguida, voltar ao espaço corrigido de gama. Aproximações mais eficientes também são possíveis, como com uma média ponderada luma ou iterativamente com tabelas de pesquisa no WebP e o recurso "Sharp YUV" do sjpeg.

Cores fora da gama

Outro artefato que pode ocorrer com a subamostragem do croma é que cores fora da gama podem ocorrer na reconstrução do croma. Suponha que a imagem consistisse em linhas vermelhas e pretas de 1 pixel alternadas e a subamostragem omitisse o croma para os pixels pretos. O croma dos pixels vermelhos será reconstruído nos pixels pretos, fazendo com que os novos pixels tenham valores positivos de vermelho e negativos de verde e azul. Como os monitores não podem emitir luz negativa (não existe luz negativa), esses valores negativos serão efetivamente cortados e o valor luma resultante será muito alto. Artefatos semelhantes surgem no exemplo menos artificial de gradação perto de um limite vermelho / preto bastante nítido.

Outros tipos de filtragem durante a subamostragem também podem fazer com que as cores saiam da gama.

Terminologia

O termo Y'UV se refere a um esquema de codificação de TV analógica (ITU-R Rec. BT.470), enquanto Y'CbCr se refere a um esquema de codificação digital. Uma diferença entre os dois é que os fatores de escala nos componentes de croma (U, V, Cb e Cr) são diferentes. No entanto, o termo YUV é freqüentemente usado erroneamente para se referir à codificação Y'CbCr. Portanto, expressões como "4: 2: 2 YUV" sempre se referem a 4: 2: 2 Y'CbCr, uma vez que simplesmente não existe 4: x: x na codificação analógica (como YUV). Os formatos de pixel usados ​​em Y'CbCr também podem ser referidos como YUV, por exemplo yuv420p, yuvj420p e muitos outros.

Na mesma linha, o termo luminância e o símbolo Y são freqüentemente usados ​​erroneamente para se referir a luma, que é denotado com o símbolo Y '. Observe que o luma (Y ') da engenharia de vídeo desvia da luminância (Y) da ciência da cor (conforme definido pela CIE ). Luma é formado como a soma ponderada dos componentes RGB corrigidos por gama (tristímulus). A luminância é formada como uma soma ponderada de componentes RGB lineares (tristimulus).

Na prática, o símbolo CIE Y é freqüentemente usado incorretamente para denotar luma. Em 1993, o SMPTE adotou a Diretriz de Engenharia EG 28, esclarecendo os dois termos. Observe que o símbolo principal 'é usado para indicar a correção de gama.

Da mesma forma, o croma da engenharia de vídeo difere do crominância da ciência da cor. O croma da engenharia de vídeo é formado a partir de componentes tristímulus ponderados (correção de gama, OETF), não componentes lineares. Na prática da engenharia de vídeo, os termos croma , crominância e saturação são freqüentemente usados ​​alternadamente para se referir à crominância, mas não é uma boa prática, como diz ITU-T Rec H.273.

História

A subamostragem croma foi desenvolvida na década de 1950 por Alda Bedford para o desenvolvimento da televisão em cores pela RCA , que se desenvolveu no padrão NTSC ; A separação luma-chroma foi desenvolvida anteriormente, em 1938, por Georges Valensi . Por meio de estudos, ele mostrou que o olho humano tem alta resolução apenas para preto e branco, um pouco menos para cores "intermediárias" como amarelos e verdes, e muito menos para cores no final do espectro, vermelhos e azuis. Usar esse conhecimento permitiu que a RCA desenvolvesse um sistema no qual descartava a maior parte do sinal azul depois que ele vinha da câmera, mantendo a maior parte do verde e apenas parte do vermelho; esta é a subamostragem de croma no espaço de cores YIQ e é aproximadamente análoga à subamostragem 4: 2: 1, pois tem resolução decrescente para luma, amarelo / verde e vermelho / azul.

Veja também

Referências

links externos