Normalmente distribuído e não correlacionado não implica independente - Normally distributed and uncorrelated does not imply independent

Na teoria da probabilidade , embora exemplos simples ilustrem que a não correlação linear de duas variáveis ​​aleatórias em geral não implica sua independência , às vezes se pensa erroneamente que isso implica quando as duas variáveis ​​aleatórias são normalmente distribuídas . Este artigo demonstra que a suposição de distribuições normais não tem essa consequência, embora a distribuição normal multivariada , incluindo a distribuição normal bivariada , tenha.

Dizer que o par de variáveis ​​aleatórias tem uma distribuição normal bivariada significa que cada combinação linear de e para coeficientes constantes (ou seja, não aleatórios) e tem uma distribuição normal univariada. Nesse caso, se e não estiverem correlacionados, eles são independentes. No entanto, é possível que duas variáveis aleatórias e para ser distribuído em conjunto de modo que cada uma por si só é marginalmente normalmente distribuída, e eles não estão correlacionados, mas eles não são independentes; exemplos são dados abaixo.

Exemplos

Um exemplo simétrico

Duas variáveis ​​normalmente distribuídas, não correlacionadas, mas dependentes.
Gama conjunta de e . Mais escuro indica um valor mais alto da função de densidade.

Suponha que tenha uma distribuição normal com valor esperado 0 e variância 1. Deixe ter a distribuição de Rademacher , de modo que ou , cada um com probabilidade 1/2, e suponha que seja independente de . Deixe . Então

  • e não estão correlacionados;
  • ambos têm a mesma distribuição normal; e
  • e não são independentes.

Para ver isso e não estão correlacionados, pode-se considerar a covariância : por definição, é

Então, por definição das variáveis aleatórias , e , ea independência do de , um tem

Para ver que tem a mesma distribuição normal que , considere

(uma vez que e ambos têm a mesma distribuição normal), onde é a função de distribuição cumulativa da distribuição normal padrão.

Para ver isso e não ser independente, observe isso ou aquilo .

Finalmente, a distribuição da combinação linear simples concentra probabilidade positiva a 0: . Portanto, a variável aleatória não é normalmente distribuída e, portanto, também e não é normalmente distribuída em conjunto (pela definição acima).

Um exemplo assimétrico

A densidade conjunta de e . Mais escuro indica um valor mais alto de densidade.

Suponha que tenha uma distribuição normal com valor esperado 0 e variância 1. Deixe

onde é um número positivo a ser especificado abaixo. Se for muito pequeno, então a correlação será próxima se for muito grande, então será próximo a 1. Uma vez que a correlação é uma função contínua de , o teorema do valor intermediário implica que existe algum valor particular de que torna a correlação 0. Esse valor é aproximadamente 1,54. Nesse caso, e não são correlacionados, mas eles claramente não são independentes, uma vez que determina completamente .

Para ver que é normalmente distribuído - na verdade, que sua distribuição é a mesma de - alguém pode calcular sua função de distribuição cumulativa :

onde a penúltima igualdade segue da simetria da distribuição de e da simetria da condição que .

Neste exemplo, a diferença está longe de ser normalmente distribuída, uma vez que tem uma probabilidade substancial (cerca de 0,88) de ser igual a 0. Em contraste, a distribuição normal, sendo uma distribuição contínua, não tem parte discreta, isto é, ele não concentra mais do que probabilidade zero em qualquer ponto único. Conseqüentemente, e não são normalmente distribuídos em conjunto , embora sejam normalmente distribuídos separadamente.

Exemplos com suporte em quase todos os lugares em ℝ 2

É bem conhecido que a proporção de dois desvios aleatórios normais padrão independentes e tem uma distribuição de Cauchy . Pode-se igualmente começar com a variável aleatória de Cauchy e derivar a distribuição condicional de para satisfazer o requisito de que com e independente e normal padrão. Passando pela matemática, descobrimos que

em que é uma variável aleatória Rademacher e é uma variável aleatória Qui-quadrado com dois graus de liberdade.

Considere dois conjuntos de , . Observe que não é indexado por - ou seja, a mesma variável aleatória de Cauchy é usada na definição de e . Este compartilhamento de resultados em dependências entre os índices: nem, nem é independente de . No entanto, todos os e não estão correlacionados como as distribuições bivariadas têm simetria de reflexão ao longo dos eixos.

Distribuições conjuntas não normais com marginais normais.

A figura mostra gráficos de dispersão de amostras retiradas da distribuição acima. Isso fornece dois exemplos de distribuições bivariadas que não são correlacionadas e têm distribuições marginais normais, mas não são independentes. O painel esquerdo mostra a distribuição conjunta de e ; a distribuição tem suporte em todos os lugares, menos na origem. O painel direito mostra a distribuição conjunta de e ; a distribuição tem suporte em todos os lugares, exceto ao longo dos eixos e tem uma descontinuidade na origem: a densidade diverge quando a origem é abordada por qualquer caminho reto, exceto ao longo dos eixos.

Veja também

Referências

Notas