Soma de variáveis aleatórias normalmente distribuídas - Sum of normally distributed random variables

Na teoria da probabilidade , o cálculo da soma de variáveis aleatórias normalmente distribuídas é uma instância da aritmética de variáveis aleatórias , que pode ser bastante complexa com base nas distribuições de probabilidade das variáveis aleatórias envolvidas e seus relacionamentos.

Isso não deve ser confundido com a soma das distribuições normais que formam uma distribuição de mistura .

Variáveis aleatórias independentes

Deixe que X e Y ser independentes variáveis aleatórias que são normalmente distribuídos (e, portanto, também em conjunto assim), então a sua soma é também normalmente distribuídos. ou seja, se

{\ displaystyle X \ sim N (\ mu _ {X}, \ sigma _ {X} ^ {2})}

{\ displaystyle Y \ sim N (\ mu _ {Y}, \ sigma _ {Y} ^ {2})}

{\ displaystyle Z = X + Y,}

então

{\ displaystyle Z \ sim N (\ mu _ {X} + \ mu _ {Y}, \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}).}

Isso significa que a soma de duas variáveis aleatórias normalmente distribuídas independentes é normal, com sua média sendo a soma das duas médias, e sua variância sendo a soma das duas variâncias (ou seja, o quadrado do desvio padrão é a soma dos quadrados dos desvios padrão).

Para que esse resultado seja válido, a suposição de que X e Y são independentes não pode ser descartada, embora possa ser enfraquecida para a suposição de que X e Y estão juntos , em vez de separadamente, normalmente distribuídos. (Veja aqui um exemplo .)

O resultado sobre a média é válido em todos os casos, enquanto o resultado da variância requer não correlação, mas não independência.

Provas

Prova usando funções características

A função característica

{\ displaystyle \ varphi _ {X + Y} (t) = \ operatorname {E} \ left (e ^ {it (X + Y)} \ right)}

da soma de duas variáveis aleatórias independentes X e Y é apenas o produto das duas funções características separadas:

{\ displaystyle \ varphi _ {X} (t) = \ operatorname {E} \ left (e ^ {itX} \ right), \ qquad \ varphi _ {Y} (t) = \ operatorname {E} \ left ( e ^ {itY} \ right)}

de X e Y .

A função característica da distribuição normal com valor esperado μ e variância σ ² é

{\ displaystyle \ varphi (t) = \ exp \ left (it \ mu - {\ sigma ^ {2} t ^ {2} \ over 2} \ right).}

Então

{\ displaystyle {\ begin {alinhado} \ varphi _ {X + Y} (t) = \ varphi _ {X} (t) \ varphi _ {Y} (t) & = \ exp \ left (it \ mu _ {X} - {\ sigma _ {X} ^ {2} t ^ {2} \ over 2} \ right) \ exp \ left (it \ mu _ {Y} - {\ sigma _ {Y} ^ {2 } t ^ {2} \ over 2} \ right) \\ [6pt] & = \ exp \ left (it (\ mu _ {X} + \ mu _ {Y}) - {(\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}) t ^ {2} \ over 2} \ right). \ End {alinhado}}}

Esta é a função característica da distribuição normal com valor esperado e variância ${\ displaystyle \ mu _ {X} + \ mu _ {Y}}$ ${\ displaystyle \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}}$

Finalmente, lembre-se de que duas distribuições distintas não podem ter a mesma função característica, então a distribuição de X + Y deve ser apenas esta distribuição normal.

Provar usando convoluções

Para variáveis aleatórias independentes X e Y , a distribuição f _Z de Z = X + Y é igual à convolução de f _X e f _Y :

{\ displaystyle f_ {Z} (z) = \ int _ {- \ infty} ^ {\ infty} f_ {Y} (zx) f_ {X} (x) \, dx}

Dado que f _X e f _Y são densidades normais,

{\ displaystyle {\ begin {alinhados} f_ {X} (x) = {\ mathcal {N}} (x; \ mu _ {X}, \ sigma _ {X} ^ {2}) = {\ frac { 1} {{\ sqrt {2 \ pi}} \ sigma _ {X}}} e ^ {- (x- \ mu _ {X}) ^ {2} / (2 \ sigma _ {X} ^ {2 })} \\ [5pt] f_ {Y} (y) = {\ mathcal {N}} (y; \ mu _ {Y}, \ sigma _ {Y} ^ {2}) = {\ frac {1 } {{\ sqrt {2 \ pi}} \ sigma _ {Y}}} e ^ {- (y- \ mu _ {Y}) ^ {2} / (2 \ sigma _ {Y} ^ {2} )} \ end {alinhado}}}

Substituindo na convolução:

{\ displaystyle {\ begin {alinhados} f_ {Z} (z) & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Y}}} \ exp \ left [- {(zx- \ mu _ {Y}) ^ {2} \ over 2 \ sigma _ {Y} ^ {2}} \ right] {\ frac {1} { {\ sqrt {2 \ pi}} \ sigma _ {X}}} \ exp \ left [- {(x- \ mu _ {X}) ^ {2} \ over 2 \ sigma _ {X} ^ {2 }} \ right] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ sqrt {2 \ pi}} \ sigma _ {X} \ sigma _ {Y}}} \ exp \ left [- {\ frac {\ sigma _ {X} ^ {2} (zx- \ mu _ {Y}) ^ {2 } + \ sigma _ {Y} ^ {2} (x- \ mu _ {X}) ^ {2}} {2 \ sigma _ {X} ^ {2} \ sigma _ {Y} ^ {2}} } \ right] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ sqrt {2 \ pi }} \ sigma _ {X} \ sigma _ {Y}}} \ exp \ left [- {\ frac {\ sigma _ {X} ^ {2} (z ^ {2} + x ^ {2} + \ mu _ {Y} ^ {2} -2xz-2z \ mu _ {Y} + 2x \ mu _ {Y}) + \ sigma _ {Y} ^ {2} (x ^ {2} + \ mu _ { X} ^ {2} -2x \ mu _ {X})} {2 \ sigma _ {Y} ^ {2} \ sigma _ {X} ^ {2}}} \ right] \, dx \\ [6pt ] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ sqrt {2 \ pi}} \ sigma _ {X} \ sigma _ {Y}}} \ exp \ left [- {\ frac {x ^ {2} (\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}) - 2x (\ sigma _ { X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}) + \ sigm a _ {X} ^ {2} (z ^ {2} + \ mu _ {Y} ^ {2} -2z \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ { X} ^ {2}} {2 \ sigma _ {Y} ^ {2} \ sigma _ {X} ^ {2}}} \ direita] \, dx \\ [6pt] \ end {alinhado}}}

Definindo e completando o quadrado : ${\ displaystyle \ sigma _ {Z} = {\ sqrt {\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}}}}$

{\ displaystyle {\ begin {alinhados} f_ {Z} (z) & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} {\ frac {1} {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {x ^ {2} -2x {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2 } \ mu _ {X}} {\ sigma _ {Z} ^ {2}}} + {\ frac {\ sigma _ {X} ^ {2} (z ^ {2} + \ mu _ {Y} ^ {2} -2z \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X} ^ {2}} {\ sigma _ {Z} ^ {2}}}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ right) ^ {2}}} \ right] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} {\ frac {1} {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {\ left (x - {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}} {\ sigma _ {Z} ^ {2} }} \ right) ^ {2} - \ left ({\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}} {\ sigma _ {Z} ^ {2}}} \ right) ^ {2} + {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) ^ {2} + \ sigma _ {Y} ^ {2} \ mu _ {X} ^ {2}} {\ sigma _ {Z} ^ {2}}}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ direita) ^ {2}}} \ direita] \, dx \\ [6pt] & = \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} \ exp \ left [- {\ frac {\ sigma _ { Z} ^ {2} \ left (\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) ^ {2} + \ sigma _ {Y} ^ {2} \ mu _ {X} ^ {2} \ right) - \ left (\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X} \ right ) ^ {2}} {2 \ sigma _ {Z} ^ {2} \ left (\ sigma _ {X} \ sigma _ {Y} \ right) ^ {2}}} \ right] {\ frac {1 } {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {\ esquerda (x - {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}} {\ sigma _ {Z} ^ {2}}} \ right) ^ {2}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ right ) ^ {2}}} \ right] \, dx \\ [6pt] & = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} \ exp \ left [- {(z - (\ mu _ {X} + \ mu _ {Y})) ^ {2} \ over 2 \ sigma _ {Z} ^ {2}} \ right] \ int _ {- \ infty} ^ {\ infty} {\ frac {1} {{\ sqrt {2 \ pi}} {\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}}}} \ exp \ left [- {\ frac {\ left (x - {\ frac {\ sigma _ {X} ^ {2} (z- \ mu _ {Y}) + \ sigma _ {Y} ^ {2} \ mu _ {X}} {\ sigma _ {Z} ^ {2}}} \ right) ^ {2}} {2 \ left ({\ frac {\ sigma _ {X} \ sigma _ {Y}} {\ sigma _ {Z}}} \ right) ^ {2}}} \ right] \, dx \ end {alinhado} }}

A expressão na integral é uma distribuição de densidade normal em x e, portanto, a integral é avaliada como 1. O resultado desejado é o seguinte:

{\ displaystyle f_ {Z} (z) = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {Z}}} \ exp \ left [- {(z - (\ mu _ { X} + \ mu _ {Y})) ^ {2} \ over 2 \ sigma _ {Z} ^ {2}} \ right]}

Usando o teorema da convolução

Pode-se mostrar que a transformada de Fourier de uma Gaussiana , é ${\ displaystyle f_ {X} (x) = {\ mathcal {N}} (x; \ mu _ {X}, \ sigma _ {X} ^ {2})}$

{\ displaystyle {\ mathcal {F}} \ {f_ {X} \} = F_ {X} (\ omega) = \ exp \ left [-j \ omega \ mu _ {X} \ right] \ exp \ left [- {\ tfrac {\ sigma _ {X} ^ {2} \ omega ^ {2}} {2}} \ direita]}

Pelo teorema da convolução :

{\ displaystyle {\ begin {alinhados} f_ {Z} (z) & = (f_ {X} * f_ {Y}) (z) \\ [5pt] & = {\ mathcal {F}} ^ {- 1 } {\ big \ {} {\ mathcal {F}} \ {f_ {X} \} \ cdot {\ mathcal {F}} \ {f_ {Y} \} {\ big \}} \\ [5pt] & = {\ mathcal {F}} ^ {- 1} {\ big \ {} \ exp \ left [-j \ omega \ mu _ {X} \ right] \ exp \ left [- {\ tfrac {\ sigma _ {X} ^ {2} \ omega ^ {2}} {2}} \ direita] \ exp \ esquerda [-j \ omega \ mu _ {Y} \ direita] \ exp \ esquerda [- {\ tfrac { \ sigma _ {Y} ^ {2} \ omega ^ {2}} {2}} \ right] {\ big \}} \\ [5pt] & = {\ mathcal {F}} ^ {- 1} { \ big \ {} \ exp \ left [-j \ omega (\ mu _ {X} + \ mu _ {Y}) \ right] \ exp \ left [- {\ tfrac {(\ sigma _ {X} ^ {2} \ + \ sigma _ {Y} ^ {2}) \ omega ^ {2}} {2}} \ right] {\ big \}} \\ [5pt] & = {\ mathcal {N}} (z; \ mu _ {X} + \ mu _ {Y}, \ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2}) \ end {alinhado}}}

Prova geométrica

Considere primeiro o caso normalizado quando X , Y ~ N (0, 1), de modo que seus PDFs sejam

{\ displaystyle f (x) = {\ frac {1} {\ sqrt {2 \ pi \,}}} e ^ {- x ^ {2} / 2}}

e

{\ displaystyle g (y) = {\ frac {1} {\ sqrt {2 \ pi \,}}} e ^ {- y ^ {2} / 2}.}

Vamos Z = X + Y . Então o CDF para Z será

{\ displaystyle z \ mapsto \ int _ {x + y \ leq z} f (x) g (y) \, dx \, dy.}

Esta integral está sobre o semiplano que se encontra sob a linha x + y = z .

A principal observação é que a função

{\ displaystyle f (x) g (y) = {\ frac {1} {2 \ pi}} e ^ {- (x ^ {2} + y ^ {2}) / 2} \,}

é radialmente simétrico. Assim, giramos o plano de coordenadas sobre a origem, escolhendo novas coordenadas de forma que a linha x + y = z seja descrita pela equação onde é determinada geometricamente. Por causa da simetria radial, temos , e o CDF para Z é ${\ displaystyle x ', y'}$ ${\ displaystyle x '= c}$ ${\ displaystyle c = c (z)}$ ${\ displaystyle f (x) g (y) = f (x ') g (y')}$

{\ displaystyle \ int _ {x '\ leq c, y' \ in \ mathbb {R}} f (x ') g (y') \, dx '\, dy'.}

Isso é fácil de integrar; descobrimos que o CDF para Z é

{\ displaystyle \ int _ {- \ infty} ^ {c (z)} f ​​(x ') \, dx' = \ Phi (c (z)).}

Para determinar o valor , observe que giramos o plano de forma que a linha x + y = z agora corre verticalmente com o intercepto x igual a c . Portanto, c é apenas a distância da origem até a linha x + y = z ao longo da bissetriz perpendicular, que encontra a linha em seu ponto mais próximo da origem, neste caso . Portanto, a distância é , e o CDF para Z é , ou seja, ${\ displaystyle c (z)}$ ${\ displaystyle (z / 2, z / 2) \,}$ ${\ displaystyle c = {\ sqrt {(z / 2) ^ {2} + (z / 2) ^ {2}}} = z / {\ sqrt {2}} \,}$ ${\ displaystyle \ Phi (z / {\ sqrt {2}})}$ ${\ displaystyle Z = X + Y \ sim N (0,2).}$

Agora, se a , b são quaisquer constantes reais (não ambos zero), então a probabilidade encontrada pela mesma integral acima, mas com a linha limite . O mesmo método de rotação funciona e, neste caso mais geral, descobrimos que o ponto mais próximo na linha da origem está localizado a uma distância (sinalizada) ${\ displaystyle aX + bY \ leq z}$ ${\ displaystyle ax + by = z}$

{\ displaystyle {\ frac {z} {\ sqrt {a ^ {2} + b ^ {2}}}}}

longe, para que

{\ displaystyle aX + bY \ sim N (0, a ^ {2} + b ^ {2}).}

O mesmo argumento em dimensões superiores mostra que se

{\ displaystyle X_ {i} \ sim N (0, \ sigma _ {i} ^ {2}), \ qquad i = 1, \ dots, n,}

então

{\ displaystyle X_ {1} + \ cdots + X_ {n} \ sim N (0, \ sigma _ {1} ^ {2} + \ cdots + \ sigma _ {n} ^ {2}).}

Agora estamos essencialmente prontos, porque

{\ displaystyle X \ sim N (\ mu, \ sigma ^ {2}) \ Leftrightarrow {\ frac {1} {\ sigma}} (X- \ mu) \ sim N (0,1).}

Então, em geral, se

{\ displaystyle X_ {i} \ sim N (\ mu _ {i}, \ sigma _ {i} ^ {2}), \ qquad i = 1, \ dots, n,}

então

{\ displaystyle \ sum _ {i = 1} ^ {n} a_ {i} X_ {i} \ sim N \ left (\ sum _ {i = 1} ^ {n} a_ {i} \ mu _ {i }, \ sum _ {i = 1} ^ {n} (a_ {i} \ sigma _ {i}) ^ {2} \ right).}

Variáveis aleatórias correlacionadas

No caso de as variáveis X e Y serem variáveis aleatórias normalmente distribuídas em conjunto, então X + Y ainda é normalmente distribuído (consulte Distribuição normal multivariada ) e a média é a soma das médias. No entanto, as variações não são aditivas devido à correlação. De fato,

{\ displaystyle \ sigma _ {X + Y} = {\ sqrt {\ sigma _ {X} ^ {2} + \ sigma _ {Y} ^ {2} +2 \ rho \ sigma _ {X} \ sigma _ {Y}}},}

onde ρ é a correlação . Em particular, sempre que ρ <0, em seguida, a variância é inferior à soma das variações de X e Y .

Extensões desse resultado podem ser feitas para mais de duas variáveis aleatórias, usando a matriz de covariância .

Prova

Neste caso (com X e Y tendo médias zero), é preciso considerar

{\ displaystyle {\ frac {1} {2 \ pi \ sigma _ {x} \ sigma _ {y} {\ sqrt {1- \ rho ^ {2}}}}} \ iint _ {x \, y} \ exp \ left [- {\ frac {1} {2 (1- \ rho ^ {2})}} \ left ({\ frac {x ^ {2}} {\ sigma _ {x} ^ {2} }} + {\ frac {y ^ {2}} {\ sigma _ {y} ^ {2}}} - {\ frac {2 \ rho xy} {\ sigma _ {x} \ sigma _ {y}} } \ right) \ right] \ delta (z- (x + y)) \, \ mathrm {d} x \, \ mathrm {d} y.}

Como acima, faz-se a substituição ${\ displaystyle y \ rightarrow zx}$

Essa integral é mais complicada de simplificar analiticamente, mas pode ser feita facilmente usando um programa de matemática simbólica. A distribuição de probabilidade f _Z ( z ) é dada neste caso por

{\ displaystyle f_ {Z} (z) = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {+}}} \ exp \ left (- {\ frac {z ^ {2} } {2 \ sigma _ {+} ^ {2}}} \ right)}

Onde

{\ displaystyle \ sigma _ {+} = {\ sqrt {\ sigma _ {x} ^ {2} + \ sigma _ {y} ^ {2} +2 \ rho \ sigma _ {x} \ sigma _ {y }}}.}

Se considerarmos, em vez disso, Z = X - Y , então obteremos

{\ displaystyle f_ {Z} (z) = {\ frac {1} {\ sqrt {2 \ pi (\ sigma _ {x} ^ {2} + \ sigma _ {y} ^ {2} -2 \ rho \ sigma _ {x} \ sigma _ {y})}}} \ exp \ left (- {\ frac {z ^ {2}} {2 (\ sigma _ {x} ^ {2} + \ sigma _ { y} ^ {2} -2 \ rho \ sigma _ {x} \ sigma _ {y})}} \ right)}

que também pode ser reescrito com

{\ displaystyle \ sigma _ {-} = {\ sqrt {\ sigma _ {x} ^ {2} + \ sigma _ {y} ^ {2} -2 \ rho \ sigma _ {x} \ sigma _ {y }}}.}

Os desvios padrão de cada distribuição são óbvios em comparação com a distribuição normal padrão.

Languages

In other projects

Soma de variáveis aleatórias normalmente distribuídas - Sum of normally distributed random variables

Conteúdo