Teste K -quared de D'Agostino -D'Agostino's K-squared test
Em estatística , o teste K 2 de D'Agostino , batizado em homenagem a Ralph D'Agostino , é uma medida de adequação do afastamento da normalidade , ou seja, o teste visa estabelecer se a amostra dada vem ou não de uma população normalmente distribuída. O teste é baseado em transformações da curtose e assimetria da amostra , e tem poder apenas contra as alternativas em que a distribuição é assimétrica e / ou kúrtica.
Assimetria e curtose
A seguir, { x i } denota uma amostra de n observações, g 1 e g 2 são a assimetria e curtose da amostra , m j 's são os j -ésimos momentos centrais da amostra e é a média da amostra . Freqüentemente na literatura relacionada aos testes de normalidade , a assimetria e curtose são denotadas como √ β 1 e β 2, respectivamente. Tal notação pode ser inconveniente uma vez que, por exemplo, √ β 1 pode ser uma quantidade negativa.
A assimetria e curtose da amostra são definidas como
Essas quantidades estimam consistentemente a assimetria teórica e a curtose da distribuição, respectivamente. Além disso, se a amostra realmente vem de uma população normal, então as distribuições exatas da amostra finita da assimetria e curtose podem ser analisadas em termos de suas médias μ 1 , variâncias μ 2 , assimetrias γ 1 e curtose γ 2 . Isso foi feito por Pearson (1931) , que derivou as seguintes expressões:
e
Por exemplo, pode-se esperar que uma amostra com tamanho n = 1000 retirada de uma população normalmente distribuída tenha uma assimetria de 0, SD 0,08 e uma curtose de 0, SD 0,15 , onde SD indica o desvio padrão.
Assimetria de amostra transformada e curtose
A assimetria da amostra g 1 e a curtose g 2 são ambas assintoticamente normais. No entanto, a taxa de convergência para o limite da distribuição é frustrantemente lenta, especialmente para g 2 . Por exemplo, mesmo com n = 5000 observações, a curtose da amostra g 2 tem a assimetria e a curtose de aproximadamente 0,3, o que não é desprezível. A fim de remediar esta situação, tem sido sugerido para transformar as quantidades g 1 e g 2 de uma maneira que faz com que a sua distribuição mais próximo do normal padrão possível.
Em particular, D'Agostino (1970) sugeriu a seguinte transformação para a assimetria da amostra:
onde as constantes α e δ são calculadas como
e onde μ 2 = μ 2 ( g 1 ) é a variância de g 1 , e γ 2 = γ 2 ( g 1 ) é a curtose - as expressões dadas na seção anterior.
Da mesma forma, Anscombe & Glynn (1983) sugeriram uma transformação para g 2 , que funciona razoavelmente bem para tamanhos de amostra de 20 ou mais:
Onde
e μ 1 = μ 1 ( g 2 ), μ 2 = μ 2 ( g 2 ), γ 1 = γ 1 ( g 2 ) são as quantidades calculadas por Pearson.
Estatística Omnibus K 2
As estatísticas Z 1 e Z 2 podem ser combinadas para produzir um teste abrangente, capaz de detectar desvios da normalidade devido a assimetria ou curtose ( D'Agostino, Belanger & D'Agostino 1990 ) :
Se a hipótese nula de normalidade for verdadeira, então K 2 é aproximadamente χ 2 -distribuído com 2 graus de liberdade.
Observe que as estatísticas g 1 , g 2 não são independentes, apenas não correlacionadas. Portanto, suas transformadas Z 1 , Z 2 serão dependentes também ( Shenton & Bowman 1977 ), tornando a validade da aproximação de χ 2 questionável. As simulações mostram que, sob a hipótese nula, a estatística do teste K 2 é caracterizada por
valor esperado | desvio padrão | Quantil 95% | |
---|---|---|---|
n = 20 | 1.971 | 2,339 | 6,373 |
n = 50 | 2.017 | 2,308 | 6,339 |
n = 100 | 2.026 | 2.267 | 6,271 |
n = 250 | 2.012 | 2,174 | 6,129 |
n = 500 | 2,009 | 2,113 | 6.063 |
n = 1000 | 2.000 | 2.062 | 6.038 |
distribuição χ 2 (2) | 2.000 | 2.000 | 5,991 |
Veja também
Referências
- Anscombe, FJ; Glynn, William J. (1983). "Distribuição da estatística de curtose b 2 para estatísticas normais". Biometrika . 70 (1): 227–234. doi : 10.1093 / biomet / 70.1.227 . JSTOR 2335960 .
- D'Agostino, Ralph B. (1970). “Transformação para normalidade da distribuição nula de g 1 ”. Biometrika . 57 (3): 679–681. doi : 10.1093 / biomet / 57.3.679 . JSTOR 2334794 .
- D'Agostino, Ralph B .; Albert Belanger; Ralph B. D'Agostino, Jr (1990). "Uma sugestão para o uso de testes poderosos e informativos de normalidade" (PDF) . The American Statistician . 44 (4): 316–321. doi : 10.2307 / 2684359 . JSTOR 2684359 . Arquivado do original (PDF) em 25/03/2012.
- Pearson, Egon S. (1931). “Nota sobre testes de normalidade”. Biometrika . 22 (3/4): 423–424. doi : 10.1093 / biomet / 22.3-4.423 . JSTOR 2332104 .
- Shenton, LR; Bowman, Kimiko O. (1977). "Um modelo bivariado para a distribuição de √b 1 e b 2 ". Journal of the American Statistical Association . 72 (357): 206–211. doi : 10.1080 / 01621459.1977.10479940 . JSTOR 2286939 .