Teste K -quared de D'Agostino -D'Agostino's K-squared test

Em estatística , o teste K 2 de D'Agostino , batizado em homenagem a Ralph D'Agostino , é uma medida de adequação do afastamento da normalidade , ou seja, o teste visa estabelecer se a amostra dada vem ou não de uma população normalmente distribuída. O teste é baseado em transformações da curtose e assimetria da amostra , e tem poder apenas contra as alternativas em que a distribuição é assimétrica e / ou kúrtica.

Assimetria e curtose

A seguir, {  x i  } denota uma amostra de n observações, g 1 e g 2 são a assimetria e curtose da amostra , m j 's são os j -ésimos momentos centrais da amostra e é a média da amostra . Freqüentemente na literatura relacionada aos testes de normalidade , a assimetria e curtose são denotadas como β 1 e β 2, respectivamente. Tal notação pode ser inconveniente uma vez que, por exemplo, β 1 pode ser uma quantidade negativa.

A assimetria e curtose da amostra são definidas como

Essas quantidades estimam consistentemente a assimetria teórica e a curtose da distribuição, respectivamente. Além disso, se a amostra realmente vem de uma população normal, então as distribuições exatas da amostra finita da assimetria e curtose podem ser analisadas em termos de suas médias μ 1 , variâncias μ 2 , assimetrias γ 1 e curtose γ 2 . Isso foi feito por Pearson (1931) , que derivou as seguintes expressões:

e

Por exemplo, pode-se esperar que uma amostra com tamanho n = 1000 retirada de uma população normalmente distribuída tenha uma assimetria de 0, SD 0,08 e uma curtose de 0, SD 0,15 , onde SD indica o desvio padrão.

Assimetria de amostra transformada e curtose

A assimetria da amostra g 1 e a curtose g 2 são ambas assintoticamente normais. No entanto, a taxa de convergência para o limite da distribuição é frustrantemente lenta, especialmente para g 2 . Por exemplo, mesmo com n = 5000 observações, a curtose da amostra g 2 tem a assimetria e a curtose de aproximadamente 0,3, o que não é desprezível. A fim de remediar esta situação, tem sido sugerido para transformar as quantidades g 1 e g 2 de uma maneira que faz com que a sua distribuição mais próximo do normal padrão possível.

Em particular, D'Agostino (1970) sugeriu a seguinte transformação para a assimetria da amostra:

onde as constantes α e δ são calculadas como

e onde μ 2 = μ 2 ( g 1 ) é a variância de g 1 , e γ 2 = γ 2 ( g 1 ) é a curtose - as expressões dadas na seção anterior.

Da mesma forma, Anscombe & Glynn (1983) sugeriram uma transformação para g 2 , que funciona razoavelmente bem para tamanhos de amostra de 20 ou mais:

Onde

e μ 1 = μ 1 ( g 2 ), μ 2 = μ 2 ( g 2 ), γ 1 = γ 1 ( g 2 ) são as quantidades calculadas por Pearson.

Estatística Omnibus K 2

As estatísticas Z 1 e Z 2 podem ser combinadas para produzir um teste abrangente, capaz de detectar desvios da normalidade devido a assimetria ou curtose ( D'Agostino, Belanger & D'Agostino 1990 ) :

Se a hipótese nula de normalidade for verdadeira, então K 2 é aproximadamente χ 2 -distribuído com 2 graus de liberdade.

Observe que as estatísticas g 1 , g 2 não são independentes, apenas não correlacionadas. Portanto, suas transformadas Z 1 , Z 2 serão dependentes também ( Shenton & Bowman 1977 ), tornando a validade da aproximação de χ 2 questionável. As simulações mostram que, sob a hipótese nula, a estatística do teste K 2 é caracterizada por

valor esperado desvio padrão Quantil 95%
n = 20 1.971 2,339 6,373
n = 50 2.017 2,308 6,339
n = 100 2.026 2.267 6,271
n = 250 2.012 2,174 6,129
n = 500 2,009 2,113 6.063
n = 1000 2.000 2.062 6.038
distribuição χ 2 (2) 2.000 2.000 5,991

Veja também

Referências

  • Anscombe, FJ; Glynn, William J. (1983). "Distribuição da estatística de curtose b 2 para estatísticas normais". Biometrika . 70 (1): 227–234. doi : 10.1093 / biomet / 70.1.227 . JSTOR  2335960 .
  • D'Agostino, Ralph B. (1970). “Transformação para normalidade da distribuição nula de g 1 ”. Biometrika . 57 (3): 679–681. doi : 10.1093 / biomet / 57.3.679 . JSTOR  2334794 .
  • D'Agostino, Ralph B .; Albert Belanger; Ralph B. D'Agostino, Jr (1990). "Uma sugestão para o uso de testes poderosos e informativos de normalidade" (PDF) . The American Statistician . 44 (4): 316–321. doi : 10.2307 / 2684359 . JSTOR  2684359 . Arquivado do original (PDF) em 25/03/2012.
  • Pearson, Egon S. (1931). “Nota sobre testes de normalidade”. Biometrika . 22 (3/4): 423–424. doi : 10.1093 / biomet / 22.3-4.423 . JSTOR  2332104 .
  • Shenton, LR; Bowman, Kimiko O. (1977). "Um modelo bivariado para a distribuição de √b 1 e b 2 ". Journal of the American Statistical Association . 72 (357): 206–211. doi : 10.1080 / 01621459.1977.10479940 . JSTOR  2286939 .