Teorema de Berry-Esseen - Berry–Esseen theorem

Na teoria da probabilidade , o teorema do limite central afirma que, sob certas circunstâncias, a distribuição de probabilidade da média escalonada de uma amostra aleatória converge para uma distribuição normal à medida que o tamanho da amostra aumenta para o infinito. Sob suposições mais fortes, o teorema de Berry-Esseen , ou desigualdade de Berry-Esseen , dá um resultado mais quantitativo, porque também especifica a taxa na qual essa convergência ocorre, dando um limite no erro máximo de aproximação entre a distribuição normal e a distribuição verdadeira da média da amostra em escala. A aproximação é medida pela distância de Kolmogorov – Smirnov . No caso de amostras independentes , a taxa de convergência é n −1/2 , onde n é o tamanho da amostra, e a constante é estimada em termos do terceiro momento normalizado absoluto .

Declaração do teorema

As declarações do teorema variam, já que ele foi descoberto independentemente por dois matemáticos , Andrew C. Berry (em 1941) e Carl-Gustav Esseen (1942), que então, junto com outros autores, o refinou repetidamente nas décadas subsequentes.

Summands distribuídos de forma idêntica

Uma versão, sacrificando um pouco a generalidade por uma questão de clareza, é a seguinte:

Existe uma constante positiva C tal que se X 1 , X 2 , ..., são iid variáveis ​​aleatórias com E ( X 1 ) = 0, E ( X 1 2 ) = σ 2 > 0, e E (| X 1 | 3 ) = ρ <∞, e se definirmos
a média da amostra , com F n a função de distribuição cumulativa de
e Φ a função de distribuição cumulativa da distribuição normal padrão , então para todos os x e n ,
Ilustração da diferença nas funções de distribuição cumulativa aludidas no teorema.

Ou seja: dada uma sequência de variáveis ​​aleatórias independentes e distribuídas de forma idêntica , cada uma com média zero e variância positiva , se adicionalmente o terceiro momento absoluto for finito, então as funções de distribuição cumulativa da média da amostra padronizada e a distribuição normal padrão diferem (verticalmente, em um gráfico) por não mais do que o valor especificado. Observe que o erro de aproximação para todo n (e, portanto, a taxa limite de convergência para n indefinido suficientemente grande) é limitado pela ordem de n −1/2 .

Os valores calculados da constante C diminuíram acentuadamente ao longo dos anos, do valor original de 7,59 por Esseen (1942) , para 0,7882 por van Beek (1972) , depois 0,7655 por Shiganov (1986) , depois 0,7056 por Shevtsova (2007) , depois 0,7005 por Shevtsova (2008) , depois 0,5894 por Tyurin (2009) , depois 0,5129 por Korolev & Shevtsova (2010a) , depois 0,4785 por Tyurin (2010) . A revisão detalhada pode ser encontrada nos artigos Korolev & Shevtsova (2010a) e Korolev & Shevtsova (2010b) . A melhor estimativa em 2012, C  <0,4748, segue da desigualdade

devido a Shevtsova (2011) , uma vez que σ 3  ≤ ρ e 0,33554 · 1,415 <0,4748. No entanto, se ρ ≥ 1,286σ 3 , então a estimativa

o que também é comprovado em Shevtsova (2011) , fornece uma estimativa superior ainda mais restrita.

Esseen (1956) provou que a constante também satisfaz o limite inferior

Somandos distribuídos não identicamente

Sejam X 1 , X 2 , ..., variáveis ​​aleatórias independentes com E ( X i ) = 0, E ( X i 2 ) = σ i 2 > 0, e E (| X i | 3 ) = ρ i < ∞. Além disso, vamos
ser a n- ésima soma parcial normalizada . Denote F n o cdf de S n e Φ o cdf da distribuição normal padrão . Por uma questão de conveniência, denote
Em 1941, Andrew C. Berry provou que para todo n existe uma constante absoluta C 1 tal que
Onde
Independentemente, em 1942, Carl-Gustav Esseen provou que para todo n existe uma constante absoluta C 0 tal que
Onde

É fácil ter certeza de que ψ 0 ≤ψ 1 . Devido a essa circunstância, a desigualdade (3) é convencionalmente chamada de desigualdade de Berry-Esseen, e a quantidade ψ 0 é chamada de fração de Lyapunov de terceira ordem. Além disso, no caso em que a soma X 1 , ..., X n têm distribuições idênticas

e, portanto, os limites indicados pelas desigualdades (1), (2) e (3) coincidem além da constante.

Em relação a C 0 , obviamente, o limite inferior estabelecido por Esseen (1956) permanece válido:

Os limites superiores para C 0 foram posteriormente reduzidos da estimativa original 7,59 devido a Esseen (1942) para (considerando apenas os resultados recentes) 0,9051 devido a Zolotarev (1967) , 0,7975 devido a van Beek (1972) , 0,7915 devido a Shiganov (1986 ) , 0,6379 e 0,5606 devido a Tyurin (2009) e Tyurin (2010) . Em 2011, a melhor estimativa é 0,5600 obtida por Shevtsova (2010) .

Versão multidimensional

Tal como acontece com o teorema do limite central multidimensional , existe uma versão multidimensional do teorema de Berry-Esseen.

Sejam vetores aleatórios de valores independentes, cada um tendo média zero. Escreva e presuma que é invertível. Let Ser a -dimensional Gaussian com a mesma média e matriz de covariância que . Então, para todos os conjuntos convexos ,

,

onde é uma constante universal e (a terceira potência da norma L 2 ).

A dependência de é considerada ótima, mas pode não ser.

Veja também

Notas

  1. ^ Uma vez que as variáveis ​​aleatórias são distribuídas de forma idêntica, X 2 , X 3 , ... todos têm os mesmos momentos que X 1 .

Referências

links externos