Distribuição T -quared de Hotelling -Hotelling's T-squared distribution

Distribuição T ^{2 de} Hotelling
	Função densidade de probabilidade
	Função de distribuição cumulativa
Parâmetros	p - dimensão das variáveis aleatórias ; m - relacionada ao tamanho da amostra
Apoiar	caso contrário.;

Em estatísticas , particularmente em testes de hipóteses , o de Hotelling T -squared distribuição ( T ² ), proposto por Harold Hotelling , é uma distribuição de probabilidade multivariada, que está firmemente relacionados com a F -distribuição e é mais notável para que surja como a distribuição de um conjunto de estatísticas da amostra que são generalizações naturais das estatísticas subjacentes à Student t -Distribuição .

A de Hotelling t estatística -squared ( t ² ) é uma generalização de Student t -statistic que é usado em multivariada testes de hipóteses .

Motivação

A distribuição surge em estatísticas multivariadas na realização de testes das diferenças entre as médias (multivariadas) de diferentes populações, onde os testes para problemas univariados fariam uso de um teste- t . A distribuição recebeu o nome de Harold Hotelling , que a desenvolveu como uma generalização da distribuição t de Student.

Definição

Se o vetor tem distribuição multivariada gaussiana com média zero e matriz de covariância unitária e é uma matriz com matriz de escala unitária e m graus de liberdade com uma distribuição de Wishart , então a forma quadrática tem uma distribuição de Hotelling (com parâmetros e ): ${\ displaystyle d}$ ${\ displaystyle N (\ mathbf {0} _ {p}, \ mathbf {I} _ {p, p})}$ ${\ displaystyle M}$ ${\ displaystyle p \ times p}$ ${\ displaystyle W (\ mathbf {I} _ {p, p}, m)}$ ${\ displaystyle X}$ ${\ displaystyle p}$ ${\ displaystyle m}$

{\ displaystyle X = md ^ {T} M ^ {- 1} d \ sim T ^ {2} (p, m).}

Além disso, se uma variável aleatória X tem distribuição T quadrada de Hotelling , então: ${\ displaystyle X \ sim T_ {p, m} ^ {2}}$

{\ displaystyle {\ frac {m-p + 1} {pm}} X \ sim F_ {p, m-p + 1}}

onde representa a F -distribuição com parâmetros p e m-p + 1 . ${\ displaystyle F_ {p, m-p + 1}}$

Estatística t -quared de Hotelling

Deixe ser a covariância de amostra : ${\ displaystyle {\ hat {\ mathbf {\ Sigma}}}}$

{\ displaystyle {\ hat {\ mathbf {\ Sigma}}} = {\ frac {1} {n-1}} \ sum _ {i = 1} ^ {n} (\ mathbf {x} _ {i} - {\ overline {\ mathbf {x}}}) (\ mathbf {x} _ {i} - {\ overline {\ mathbf {x}}}) '}

onde denotamos transpor por um apóstrofo . Pode-se mostrar que é uma matriz positiva (semi) definida e segue uma distribuição p- variada de Wishart com n -1 graus de liberdade. A matriz de covariância de amostra das leituras médias . ${\ displaystyle {\ hat {\ mathbf {\ Sigma}}}}$ ${\ displaystyle (n-1) {\ hat {\ mathbf {\ Sigma}}}}$ ${\ displaystyle {\ hat {\ mathbf {\ Sigma}}} _ {\ overline {\ mathbf {x}}} = {\ hat {\ mathbf {\ Sigma}}} / n}$

A estatística t -quared de Hotelling é então definida como:

{\ displaystyle t ^ {2} = ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) '{\ hat {\ mathbf {\ Sigma}}} _ {\ overline {\ mathbf {x}}} ^ {- 1} ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mathbf {\ mu}}}),}

que é proporcional à distância entre a média da amostra e . Por causa disso, deve-se esperar que a estatística assuma valores baixos se e valores altos se forem diferentes. ${\ displaystyle {\ boldsymbol {\ mu}}}$ ${\ displaystyle {\ overline {\ mathbf {x}}} \ approx {\ boldsymbol {\ mu}}}$

Da distribuição ,

{\ displaystyle t ^ {2} \ sim T_ {p, n-1} ^ {2} = {\ frac {p (n-1)} {np}} F_ {p, np},}

onde representa a F -distribuição com parâmetros p e n - p . ${\ displaystyle F_ {p, np}}$

A fim de calcular um valor p (não relacionado com a variável p aqui), observe que a distribuição de equivalentemente implica que ${\ displaystyle t ^ {2}}$

{\ displaystyle {\ frac {np} {p (n-1)}} t ^ {2} \ sim F_ {p, np}.}

Em seguida, use a quantidade do lado esquerdo para avaliar o valor p correspondente à amostra, que vem da distribuição F. Uma região de confiança também pode ser determinada usando uma lógica semelhante.

Motivação

Deixe denotar uma distribuição normal p -variate com localização e covariância conhecida . Deixar ${\ displaystyle {\ mathcal {N}} _ {p} ({\ boldsymbol {\ mu}}, {\ mathbf {\ Sigma}})}$ ${\ displaystyle {\ boldsymbol {\ mu}}}$ ${\ displaystyle {\ mathbf {\ Sigma}}}$

{\ displaystyle {\ mathbf {x}} _ {1}, \ dots, {\ mathbf {x}} _ {n} \ sim {\ mathcal {N}} _ {p} ({\ boldsymbol {\ mu} }, {\ mathbf {\ Sigma}})}

ser n variáveis aleatórias distribuídas identicamente (iid) independentes , que podem ser representadas como vetores de coluna de números reais. Definir ${\ displaystyle p \ times 1}$

{\ displaystyle {\ overline {\ mathbf {x}}} = {\ frac {\ mathbf {x} _ {1} + \ cdots + \ mathbf {x} _ {n}} {n}}}

para ser a média da amostra com covariância . Pode-se mostrar que ${\ displaystyle {\ mathbf {\ Sigma}} _ {\ overline {\ mathbf {x}}} = {\ mathbf {\ Sigma}} / n}$

{\ displaystyle ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) '{\ mathbf {\ Sigma}} _ {\ overline {\ mathbf {x}}} ^ {- 1 } ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mathbf {\ mu}}}) \ sim \ chi _ {p} ^ {2},}

onde é a distribuição qui-quadrada com p graus de liberdade. ${\ displaystyle \ chi _ {p} ^ {2}}$

Prova

Prova -

Para mostrar isso, use o fato de que e derivar a função característica da variável aleatória . Como de costume, vamos denotar o determinante do argumento, como em . ${\ displaystyle {\ overline {\ mathbf {x}}} \ sim {\ mathcal {N}} _ {p} ({\ boldsymbol {\ mu}}, {\ mathbf {\ Sigma}} / n)}$ ${\ displaystyle \ mathbf {y} = ({\ bar {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) '{\ mathbf {\ Sigma}} _ {\ bar {\ mathbf {x} }} ^ {- 1} ({\ bar {\ mathbf {x}}} - {\ boldsymbol {\ mathbf {\ mu}}}) = ({\ bar {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) '({\ mathbf {\ Sigma}} / n) ^ {- 1} ({\ bar {\ mathbf {x}}} - {\ boldsymbol {\ mathbf {\ mu}}}) }$ ${\ displaystyle | \ cdot |}$ ${\ displaystyle | {\ boldsymbol {\ Sigma}} |}$

Por definição de função característica, temos:

{\ displaystyle {\ begin {alinhados} \ varphi _ {\ mathbf {y}} (\ theta) & = \ operatorname {E} e ^ {i \ theta \ mathbf {y}}, \\ [5pt] & = \ operatorname {E} e ^ {i \ theta ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) '({\ mathbf {\ Sigma}} / n) ^ {- 1 } ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mathbf {\ mu}}})} \\ [5pt] & = \ int e ^ {i \ theta ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) 'n {\ mathbf {\ Sigma}} ^ {- 1} ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mathbf { \ mu}}})} (2 \ pi) ^ {- p / 2} | {\ boldsymbol {\ Sigma}} / n | ^ {- 1/2} \, e ^ {- (1/2) ( {\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) 'n {\ boldsymbol {\ Sigma}} ^ {- 1} ({\ overline {\ mathbf {x}}} - { \ boldsymbol {\ mu}})} \, dx_ {1} \ cdots dx_ {p} \ end {alinhado}}}

Existem duas exponenciais dentro da integral, então, multiplicando as exponenciais, adicionamos os exponentes, obtendo:

{\ displaystyle {\ begin {align} & = \ int (2 \ pi) ^ {- p / 2} | {\ boldsymbol {\ Sigma}} / n | ^ {- 1/2} \, e ^ {- (1/2) ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) 'n ({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}})} \, dx_ {1} \ cdots dx_ {p} \ end {alinhados }}}

Agora tire o termo da integral e multiplique tudo por uma identidade , trazendo uma delas para dentro da integral: ${\ displaystyle | {\ boldsymbol {\ Sigma}} / n | ^ {- 1/2}}$ ${\ displaystyle I = | ({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ^ {- 1} / n | ^ {1 / 2} \; \ cdot \; | ({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ^ {- 1} / n | ^ {-1/2}}$

{\ displaystyle {\ begin {align} & = | ({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ^ {- 1} / n | ^ {1/2} | {\ boldsymbol {\ Sigma}} / n | ^ {- 1/2} \ int (2 \ pi) ^ {- p / 2} | ({\ boldsymbol {\ Sigma} } ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ^ {- 1} / n | ^ {- 1/2} \, e ^ {- (1/2) n ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}}) '({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ({\ overline {\ mathbf {x}}} - {\ boldsymbol {\ mu}})} \, dx_ {1} \ cdots dx_ {p} \ end {alinhado}}}

Mas o termo dentro da integral é precisamente a função de densidade de probabilidade de uma distribuição normal multivariada com matriz de covariância e média , portanto, ao integrar tudo , deve render de acordo com os axiomas de probabilidade . Assim, acabamos com: ${\ displaystyle ({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ^ {- 1} / n = \ left [n ({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) \ right] ^ {- 1}}$ ${\ displaystyle \ mu}$ ${\ displaystyle x_ {1}, \ dots, x_ {p}}$ ${\ displaystyle 1}$

{\ displaystyle {\ begin {align} & = \ left | ({\ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ^ {- 1 } \ cdot {\ frac {1} {n}} \ right | ^ {1/2} | {\ boldsymbol {\ Sigma}} / n | ^ {- 1/2} \\ & = \ left | ({ \ boldsymbol {\ Sigma}} ^ {- 1} -2i \ theta {\ boldsymbol {\ Sigma}} ^ {- 1}) ^ {- 1} \ cdot {\ frac {1} {\ cancel {n}} } \ cdot {\ cancel {n}} \ cdot {\ boldsymbol {\ Sigma}} ^ {- 1} \ right | ^ {1/2} \\ & = \ left | \ left [({\ cancel {{ \ boldsymbol {\ Sigma}} ^ {- 1}}} - 2i \ theta {\ cancel {{\ boldsymbol {\ Sigma}} ^ {- 1}}}) {\ cancel {\ boldsymbol {\ Sigma}}} \ right] ^ {- 1} \ right | ^ {1/2} \\ & = | \ mathbf {I} _ {p} -2i \ theta \ mathbf {I} _ {p} | ^ {- 1 / 2} \ end {alinhado}}}

onde está uma matriz de identidade de dimensão . Finalmente, calculando o determinante, obtemos: ${\ displaystyle I_ {p}}$ ${\ displaystyle p}$

{\ displaystyle {\ begin {alinhados} & = (1-2i \ theta) ^ {- p / 2} \ end {alinhados}}}

que é a função característica para uma distribuição qui-quadrado com graus de liberdade. ${\ displaystyle p}$ ${\ displaystyle \; \; \; \ blacksquare}$

Estatística de duas amostras

Se e , com as amostras retiradas independentemente de duas distribuições normais multivariadas independentes com a mesma média e covariância, e definimos ${\ displaystyle {\ mathbf {x}} _ {1}, \ dots, {\ mathbf {x}} _ {n_ {x}} \ sim N_ {p} ({\ boldsymbol {\ mu}}, {\ mathbf {\ Sigma}})}$ ${\ displaystyle {\ mathbf {y}} _ {1}, \ dots, {\ mathbf {y}} _ {n_ {y}} \ sim N_ {p} ({\ boldsymbol {\ mu}}, {\ mathbf {\ Sigma}})}$

{\ displaystyle {\ overline {\ mathbf {x}}} = {\ frac {1} {n_ {x}}} \ sum _ {i = 1} ^ {n_ {x}} \ mathbf {x} _ { i} \ qquad {\ overline {\ mathbf {y}}} = {\ frac {1} {n_ {y}}} \ sum _ {i = 1} ^ {n_ {y}} \ mathbf {y} _ {eu}}

como a amostra significa, e

{\ displaystyle {\ hat {\ mathbf {\ Sigma}}} _ {\ mathbf {x}} = {\ frac {1} {n_ {x} -1}} \ sum _ {i = 1} ^ {n_ {x}} (\ mathbf {x} _ {i} - {\ overline {\ mathbf {x}}}) (\ mathbf {x} _ {i} - {\ overline {\ mathbf {x}}}) '}

{\ displaystyle {\ hat {\ mathbf {\ Sigma}}} _ {\ mathbf {y}} = {\ frac {1} {n_ {y} -1}} \ sum _ {i = 1} ^ {n_ {y}} (\ mathbf {y} _ {i} - {\ overline {\ mathbf {y}}}) (\ mathbf {y} _ {i} - {\ overline {\ mathbf {y}}}) '}

como as respectivas matrizes de covariância de amostra. Então

{\ displaystyle {\ hat {\ mathbf {\ Sigma}}} = {\ frac {(n_ {x} -1) {\ hat {\ mathbf {\ Sigma}}} _ {\ mathbf {x}} + ( n_ {y} -1) {\ hat {\ mathbf {\ Sigma}}} _ {\ mathbf {y}}} {n_ {x} + n_ {y} -2}}}

é a estimativa da matriz de covariância combinada imparcial (uma extensão da variância combinada ).

Finalmente, a estatística t- quadrada de duas amostras de Hotelling é

{\ displaystyle t ^ {2} = {\ frac {n_ {x} n_ {y}} {n_ {x} + n_ {y}}} ({\ overline {\ mathbf {x}}} - {\ overline {\ mathbf {y}}}) '{\ hat {\ mathbf {\ Sigma}}} ^ {- 1} ({\ overline {\ mathbf {x}}} - {\ overline {\ mathbf {y}} }) \ sim T ^ {2} (p, n_ {x} + n_ {y} -2)}

Conceitos relacionados

Pode estar relacionado à distribuição F por

{\ displaystyle {\ frac {n_ {x} + n_ {y} -p-1} {(n_ {x} + n_ {y} -2) p}} t ^ {2} \ sim F (p, n_ {x} + n_ {y} -1-p).}

A distribuição não nula desta estatística é a distribuição F não central (a proporção de uma variável aleatória qui-quadrada não central e uma variável aleatória qui-quadrada central independente )

{\ displaystyle {\ frac {n_ {x} + n_ {y} -p-1} {(n_ {x} + n_ {y} -2) p}} t ^ {2} \ sim F (p, n_ {x} + n_ {y} -1-p; \ delta),}

com

{\ displaystyle \ delta = {\ frac {n_ {x} n_ {y}} {n_ {x} + n_ {y}}} {\ boldsymbol {d}} '\ mathbf {\ Sigma} ^ {- 1} {\ boldsymbol {d}},}

onde é o vetor de diferença entre as médias da população. ${\ displaystyle {\ boldsymbol {d}} = \ mathbf {{\ overline {x}} - {\ overline {y}}}}$

No caso de duas variáveis, a fórmula simplifica muito bem, permitindo a apreciação de como a correlação,, entre as variáveis afeta . Se definirmos ${\ displaystyle \ rho}$ ${\ displaystyle t ^ {2}}$

{\ displaystyle d_ {1} = {\ overline {x}} _ {1} - {\ overline {y}} _ {1}, \ qquad d_ {2} = {\ overline {x}} _ {2} - {\ overline {y}} _ {2}}

e

{\ displaystyle s_ {1} = {\ sqrt {\ Sigma _ {11}}} \ qquad s_ {2} = {\ sqrt {\ Sigma _ {22}}} \ qquad \ rho = \ Sigma _ {12} / (s_ {1} s_ {2}) = \ Sigma _ {21} / (s_ {1} s_ {2})}

então

{\ displaystyle t ^ {2} = {\ frac {n_ {x} n_ {y}} {(n_ {x} + n_ {y}) (1-r ^ {2})}} \ left [\ left ({\ frac {d_ {1}} {s_ {1}}} \ direita) ^ {2} + \ esquerda ({\ frac {d_ {2}} {s_ {2}}} \ direita) ^ {2 } -2 \ rho \ left ({\ frac {d_ {1}} {s_ {1}}} \ right) \ left ({\ frac {d_ {2}} {s_ {2}}} \ right) \ direito]}

Assim, se as diferenças nas duas linhas do vetor forem do mesmo sinal, em geral, torna-se menor à medida que se torna mais positivo. Se as diferenças são de sinal oposto torna-se tanto maior quanto mais positivo. ${\ displaystyle \ mathbf {d} = {\ overline {\ mathbf {x}}} - {\ overline {\ mathbf {y}}}}$ ${\ displaystyle t ^ {2}}$ ${\ displaystyle \ rho}$ ${\ displaystyle t ^ {2}}$ ${\ displaystyle \ rho}$

Um caso especial univariado pode ser encontrado no teste t de Welch .

Testes mais robustos e poderosos do que o teste de duas amostras de Hotelling foram propostos na literatura, ver por exemplo os testes baseados em distância entre pontos que podem ser aplicados também quando o número de variáveis é comparável com, ou mesmo maior do que, o número de sujeitos.

Veja também

Teste t de Student em estatística univariada
Student t -Distribuição na teoria da probabilidade univariada
Distribuição multivariada de alunos
Distribuição F (comumente tabulada ou disponível em bibliotecas de software e, portanto, usada para testar aestatística T- quadrada usando a relação fornecida acima)
Distribuição lambda de Wilks (em estatísticas multivariadas , Λ de Wilks está para T ^{2 de} Hotelling como F de Snedecor está para t de Student em estatísticas univariadas)

Referências

links externos

Prokhorov, AV (2001) [1994], T ² -distribution "Hotelling T ² -distribution" , Encyclopedia of Mathematics , EMS Press

Languages

In other projects

Distribuição T -quared de Hotelling -Hotelling's T-squared distribution

Conteúdo

Motivação

Definição

Estatística t -quared de Hotelling

Motivação

Estatística de duas amostras

Conceitos relacionados

Veja também

Referências

links externos