Teste K -quared de D'Agostino -D'Agostino's K-squared test

Em estatística , o teste K ^{2 de} D'Agostino , batizado em homenagem a Ralph D'Agostino , é uma medida de adequação do afastamento da normalidade , ou seja, o teste visa estabelecer se a amostra dada vem ou não de uma população normalmente distribuída. O teste é baseado em transformações da curtose e assimetria da amostra , e tem poder apenas contra as alternativas em que a distribuição é assimétrica e / ou kúrtica.

Assimetria e curtose

A seguir, { x _i } denota uma amostra de n observações, g ₁ e g ₂ são a assimetria e curtose da amostra , m _j 's são os j -ésimos momentos centrais da amostra e é a média da amostra . Freqüentemente na literatura relacionada aos testes de normalidade , a assimetria e curtose são denotadas como √ β ₁ e β _2, respectivamente. Tal notação pode ser inconveniente uma vez que, por exemplo, √ β ₁ pode ser uma quantidade negativa. ${\ displaystyle {\ bar {x}}}$

A assimetria e curtose da amostra são definidas como

{\ displaystyle {\ begin {align} & g_ {1} = {\ frac {m_ {3}} {m_ {2} ^ {3/2}}} = {\ frac {{\ frac {1} {n} } \ sum _ {i = 1} ^ {n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {3}} {\ left ({\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {2} \ right) ^ {3/2}}} \, \\ & g_ {2} = {\ frac {m_ {4}} {m_ {2} ^ {2}}} - 3 = {\ frac {{\ frac {1} {n}} \ sum _ {i = 1} ^ {n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {4}} {\ left ({\ frac {1} {n}} \ sum _ {i = 1} ^ { n} \ left (x_ {i} - {\ bar {x}} \ right) ^ {2} \ right) ^ {2}}} - 3 \. \ end {alinhado}}}

Essas quantidades estimam consistentemente a assimetria teórica e a curtose da distribuição, respectivamente. Além disso, se a amostra realmente vem de uma população normal, então as distribuições exatas da amostra finita da assimetria e curtose podem ser analisadas em termos de suas médias μ ₁ , variâncias μ ₂ , assimetrias γ ₁ e curtose γ ₂ . Isso foi feito por Pearson (1931) , que derivou as seguintes expressões:

{\ displaystyle {\ begin {alinhados} & \ mu _ {1} (g_ {1}) = 0, \\ & \ mu _ {2} (g_ {1}) = {\ frac {6 (n-2 )} {(n + 1) (n + 3)}}, \\ & \ gamma _ {1} (g_ {1}) \ equiv {\ frac {\ mu _ {3} (g_ {1})} {\ mu _ {2} (g_ {1}) ^ {3/2}}} = 0, \\ & \ gamma _ {2} (g_ {1}) \ equiv {\ frac {\ mu _ {4 } (g_ {1})} {\ mu _ {2} (g_ {1}) ^ {2}}} - 3 = {\ frac {36 (n-7) (n ^ {2} + 2n-5 )} {(n-2) (n + 5) (n + 7) (n + 9)}}. \ end {alinhado}}}

e

{\ displaystyle {\ begin {alinhados} & \ mu _ {1} (g_ {2}) = - {\ frac {6} {n + 1}}, \\ & \ mu _ {2} (g_ {2 }) = {\ frac {24n (n-2) (n-3)} {(n + 1) ^ {2} (n + 3) (n + 5)}}, \\ & \ gamma _ {1 } (g_ {2}) \ equiv {\ frac {\ mu _ {3} (g_ {2})} {\ mu _ {2} (g_ {2}) ^ {3/2}}} = {\ frac {6 (n ^ {2} -5n + 2)} {(n + 7) (n + 9)}} {\ sqrt {\ frac {6 (n + 3) (n + 5)} {n ( n-2) (n-3)}}}, \\ & \ gamma _ {2} (g_ {2}) \ equiv {\ frac {\ mu _ {4} (g_ {2})} {\ mu _ {2} (g_ {2}) ^ {2}}} - 3 = {\ frac {36 (15n ^ {6} -36n ^ {5} -628n ^ {4} + 982n ^ {3} + 5777n ^ {2} -6402n + 900)} {n (n-3) (n-2) (n + 7) (n + 9) (n + 11) (n + 13)}}. \ End {alinhado} }}

Por exemplo, pode-se esperar que uma amostra com tamanho n = 1000 retirada de uma população normalmente distribuída tenha uma assimetria de 0, SD 0,08 e uma curtose de 0, SD 0,15 , onde SD indica o desvio padrão.

Assimetria de amostra transformada e curtose

A assimetria da amostra g ₁ e a curtose g ₂ são ambas assintoticamente normais. No entanto, a taxa de convergência para o limite da distribuição é frustrantemente lenta, especialmente para g ₂ . Por exemplo, mesmo com n = 5000 observações, a curtose da amostra g ₂ tem a assimetria e a curtose de aproximadamente 0,3, o que não é desprezível. A fim de remediar esta situação, tem sido sugerido para transformar as quantidades g ₁ e g ₂ de uma maneira que faz com que a sua distribuição mais próximo do normal padrão possível.

Em particular, D'Agostino (1970) sugeriu a seguinte transformação para a assimetria da amostra:

{\ displaystyle Z_ {1} (g_ {1}) = \ delta \ operatorname {asinh} \ left ({\ frac {g_ {1}} {\ alpha {\ sqrt {\ mu _ {2}}}}} \certo),}

onde as constantes α e δ são calculadas como

{\ displaystyle {\ begin {alinhados} & W ^ {2} = {\ sqrt {2 \ gamma _ {2} +4}} - 1, \\ & \ delta = 1 / {\ sqrt {\ ln W}} , \\ & \ alpha ^ {2} = 2 / (W ^ {2} -1), \ end {alinhado}}}

e onde μ ₂ = μ ₂ ( g ₁ ) é a variância de g ₁ , e γ ₂ = γ ₂ ( g ₁ ) é a curtose - as expressões dadas na seção anterior.

Da mesma forma, Anscombe & Glynn (1983) sugeriram uma transformação para g ₂ , que funciona razoavelmente bem para tamanhos de amostra de 20 ou mais:

{\ displaystyle Z_ {2} (g_ {2}) = {\ sqrt {\ frac {9A} {2}}} \ left \ {1 - {\ frac {2} {9A}} - \ left ({\ frac {1-2 / A} {1 + {\ frac {g_ {2} - \ mu _ {1}} {\ sqrt {\ mu _ {2}}}} {\ sqrt {2 / (A-4 )}}}} \ right) ^ {\! 1/3} \ right \},}

Onde

{\ displaystyle A = 6 + {\ frac {8} {\ gamma _ {1}}} \ left ({\ frac {2} {\ gamma _ {1}}} + {\ sqrt {1 + 4 / \ gamma _ {1} ^ {2}}} \ right),}

e μ ₁ = μ ₁ ( g ₂ ), μ ₂ = μ ₂ ( g ₂ ), γ ₁ = γ ₁ ( g ₂ ) são as quantidades calculadas por Pearson.

Estatística Omnibus K ²

As estatísticas Z ₁ e Z ₂ podem ser combinadas para produzir um teste abrangente, capaz de detectar desvios da normalidade devido a assimetria ou curtose ( D'Agostino, Belanger & D'Agostino 1990 ) :

{\ displaystyle K ^ {2} = Z_ {1} (g_ {1}) ^ {2} + Z_ {2} (g_ {2}) ^ {2} \,}

Se a hipótese nula de normalidade for verdadeira, então K ² é aproximadamente χ ² -distribuído com 2 graus de liberdade.

Observe que as estatísticas g ₁ , g ₂ não são independentes, apenas não correlacionadas. Portanto, suas transformadas Z ₁ , Z ₂ serão dependentes também ( Shenton & Bowman 1977 ), tornando a validade da aproximação de χ ² questionável. As simulações mostram que, sob a hipótese nula, a estatística do teste K ² é caracterizada por

	valor esperado	desvio padrão	Quantil 95%
n = 20	1.971	2,339	6,373
n = 50	2.017	2,308	6,339
n = 100	2.026	2.267	6,271
n = 250	2.012	2,174	6,129
n = 500	2,009	2,113	6.063
n = 1000	2.000	2.062	6.038
distribuição χ ² (2)	2.000	2.000	5,991

Veja também

Referências

Anscombe, FJ; Glynn, William J. (1983). "Distribuição da estatística de curtose b ₂ para estatísticas normais". Biometrika . 70 (1): 227–234. doi : 10.1093 / biomet / 70.1.227 . JSTOR 2335960 .
D'Agostino, Ralph B. (1970). “Transformação para normalidade da distribuição nula de g ₁ ”. Biometrika . 57 (3): 679–681. doi : 10.1093 / biomet / 57.3.679 . JSTOR 2334794 .
D'Agostino, Ralph B .; Albert Belanger; Ralph B. D'Agostino, Jr (1990). "Uma sugestão para o uso de testes poderosos e informativos de normalidade" (PDF) . The American Statistician . 44 (4): 316–321. doi : 10.2307 / 2684359 . JSTOR 2684359 . Arquivado do original (PDF) em 25/03/2012.
Pearson, Egon S. (1931). “Nota sobre testes de normalidade”. Biometrika . 22 (3/4): 423–424. doi : 10.1093 / biomet / 22.3-4.423 . JSTOR 2332104 .
Shenton, LR; Bowman, Kimiko O. (1977). "Um modelo bivariado para a distribuição de √b ₁ e b ₂ ". Journal of the American Statistical Association . 72 (357): 206–211. doi : 10.1080 / 01621459.1977.10479940 . JSTOR 2286939 .

Languages

In other projects

Teste K -quared de D'Agostino -D'Agostino's K-squared test

Conteúdo

Assimetria e curtose

Assimetria de amostra transformada e curtose

Estatística Omnibus K ²

Veja também

Referências

Languages

In other projects

Teste K -quared de D'Agostino -D'Agostino's K-squared test

Assimetria e curtose

Assimetria de amostra transformada e curtose

Estatística Omnibus K 2

Veja também

Referências

Estatística Omnibus K ²