Relações entre distribuições de probabilidade - Relationships among probability distributions

As relações entre algumas das distribuições de probabilidade univariadas são ilustradas com linhas conectadas. linhas tracejadas significam relacionamento aproximado. mais informações: Nota: A transformação de N (mu, sigma ^ 2) para N (0, 1) deve ser (X - mu) / sigma, não (X - mu) / sigma ^ 2
Relações entre distribuições de probabilidade univariadas em ProbOnto .

Em teoria de probabilidade e estatística , existem várias relações entre distribuições de probabilidade . Essas relações podem ser categorizadas nos seguintes grupos:

  • Uma distribuição é um caso especial de outra com um espaço de parâmetros mais amplo
  • Transforms (função de uma variável aleatória);
  • Combinações (função de várias variáveis);
  • Relações de aproximação (limite);
  • Relações compostas (úteis para inferência bayesiana);
  • Dualidade ;
  • Priores conjugados .

Caso especial de parametrização de distribuição

Transformada de uma variável

Múltiplo de uma variável aleatória

Multiplicar a variável por qualquer constante real positiva resulta em uma escala da distribuição original. Alguns são auto-replicantes, o que significa que a escala produz a mesma família de distribuições, embora com um parâmetro diferente: distribuição normal , distribuição gama , distribuição de Cauchy , distribuição exponencial , distribuição Erlang , distribuição Weibull , distribuição logística , distribuição de erro , lei de potência distribuição , distribuição de Rayleigh .

Exemplo:

  • Se X for uma variável aleatória gama com parâmetros de forma e taxa ( α , β ), então Y  =  aX é uma variável aleatória gama com parâmetros ( α , β / a ).
  • Se X for uma variável aleatória gama com parâmetros de forma e escala ( k , θ ), então Y  =  aX é uma variável aleatória gama com parâmetros ( k , ).

Função linear de uma variável aleatória

A transformação afim ax + b produz uma realocação e dimensionamento da distribuição original. Os seguintes são auto-replicáveis: distribuição normal , distribuição de Cauchy , distribuição logística , distribuição de erro , distribuição de energia , distribuição de Rayleigh .

Exemplo:

  • Se Z é uma variável aleatória normal com parâmetros ( μ = m , σ 2 = s 2 ), então X = aZ + b é uma variável aleatória normal com parâmetros ( μ = am + b , σ 2 = a 2 s 2 ).

Recíproca de uma variável aleatória

O recíproco 1 / X de uma variável aleatória X , é um membro da mesma família de distribuição de X , nos seguintes casos: distribuição de Cauchy , distribuição F , distribuição logística .

Exemplos:

  • Se X é uma variável aleatória de Cauchy ( μ , σ ), então 1 / X é uma variável aleatória de Cauchy ( μ / C , σ / C ) onde C = μ 2 + σ 2 .
  • Se X for uma variável aleatória F ( ν 1 , ν 2 ), então 1 / X é uma variável aleatória F ( ν 2 , ν 1 ).

Outros casos

Algumas distribuições são invariantes sob uma transformação específica.

Exemplo:

  • Se X é uma variável aleatória beta ( α , β ), então (1 - X ) é uma variável aleatória beta ( β , α ).
  • Se X é uma variável aleatória binomial ( n , p ), então ( n - X ) é uma variável aleatória binomial ( n , 1 -  p ).
  • Se X tem função de distribuição cumulativa F X , então o inverso da distribuição cumulativa F
    X
    ( X ) é uma variável aleatória uniforme padrão (0,1)
  • Se X é uma variável aleatória normal ( µ , σ 2 ), então e X é uma variável aleatória lognormal ( µ , σ 2 ).
Por outro lado, se X é uma variável aleatória lognormal ( μ , σ 2 ), então log X é uma variável aleatória  normal ( μ , σ 2 ).
  • Se X é uma variável aleatória exponencial com média β , então X 1 / γ é uma variável aleatória Weibull ( γ , β ).
  • O quadrado de uma variável aleatória normal padrão tem uma distribuição qui-quadrada com um grau de liberdade.
  • Se X for uma variável aleatória t de Student com ν grau de liberdade, então X 2 é uma variável aleatória F (1, ν ).
  • Se X for uma variável aleatória exponencial dupla com média 0 e escala λ , então | X | é uma variável aleatória exponencial com média λ .
  • Uma variável aleatória geométrica é o piso de uma variável aleatória exponencial .
  • Uma variável aleatória retangular é o piso de uma variável aleatória uniforme .
  • Uma variável aleatória recíproca é o exponencial de uma variável aleatória uniforme .

Funções de várias variáveis

Soma das variáveis

A distribuição da soma das variáveis ​​aleatórias independentes é a convolução de suas distribuições. Suponha que seja a soma de variáveis ​​aleatórias independentes, cada uma com funções de massa de probabilidade . Então

tem

Se ela tiver uma distribuição da mesma família de distribuições das variáveis ​​originais, essa família de distribuições é considerada fechada sob convolução .

Exemplos de tais distribuições univariadas são: distribuições normais , distribuições de Poisson , distribuição binomial (com probabilidade comum sucesso), distribuição binomial negativo (com probabilidade comum sucesso), distribuições gama (com comum parâmetro taxa ), distribuições do qui-quadrado , distribuições de Cauchy , hyperexponential distribuições .

Exemplos:

    • Se X 1 e X 2 são variáveis ​​aleatórias de Poisson com médias μ 1 e μ 2 respectivamente, então X 1 + X 2 é uma variável aleatória de Poisson com média μ 1 + μ 2 .
    • A soma das variáveis ​​aleatórias gama ( α i , β ) tem uma distribuição gamaα i , β ).
    • Se X 1 é uma variável aleatória Cauchy ( μ 1 , σ 1 ) e X 2 é Cauchy ( μ 2 , σ 2 ), então X 1 + X 2 é um Cauchy ( μ 1 + μ 2 , σ 1 + σ 2 ) variável aleatória.
    • Se X 1 e X 2 são variáveis ​​aleatórias qui-quadrado com ν 1 e ν 2 graus de liberdade respectivamente, então X 1 + X 2 é uma variável aleatória qui-quadrado com ν 1 + ν 2 graus de liberdade.
    • Se X 1 for normal ( μ 1 , σ2
      1
      ) variável aleatória e X 2 é uma normal ( μ 2 , σ2
      2
      ) variável aleatória, então X 1 + X 2 é uma normal ( μ 1 + μ 2 , σ2
      1
      + σ2
      2
      ) variável aleatória.
    • A soma de N variáveis ​​aleatórias qui-quadrado (1) tem uma distribuição qui-quadrada com N graus de liberdade.

Outras distribuições não são fechadas por convolução, mas sua soma tem uma distribuição conhecida:

  • A soma de n variáveis ​​aleatórias de Bernoulli (p) é uma variável aleatória binomial ( n , p ).
  • A soma de n variáveis ​​aleatórias geométricas com probabilidade de sucesso p é uma variável aleatória binomial negativa com parâmetros n e p .
  • A soma de n variáveis ​​aleatórias exponenciais ( β ) é uma variável aleatória gama ( n , β ). Como n é um número inteiro, a distribuição gama também é uma distribuição Erlang .
  • A soma dos quadrados de N variáveis ​​aleatórias normais padrão tem uma distribuição qui-quadrada com N graus de liberdade.

Produto de variáveis

O produto das variáveis ​​aleatórias independentes X e Y pode pertencer à mesma família de distribuição que X e Y : distribuição de Bernoulli e distribuição log-normal .

Exemplo:

  • Se X 1 e X 2 forem variáveis ​​aleatórias log-normais independentes com parâmetros ( μ 1 , σ2
    1
    ) e ( μ 2 , σ2
    2
    ), respectivamente, então X 1 X 2 é uma variável aleatória log-normal com parâmetros ( μ 1 + μ 2 , σ2
    1
    + σ2
    2
    )

(Veja também distribuição de produtos .)

Mínimo e máximo de variáveis ​​aleatórias independentes

Para algumas distribuições, o valor mínimo de várias variáveis ​​aleatórias independentes é um membro da mesma família, com parâmetros diferentes: distribuição de Bernoulli , distribuição geométrica , distribuição exponencial , distribuição de valores extremos , distribuição de Pareto , distribuição de Rayleigh , distribuição de Weibull .

Exemplos:

  • Se X 1 e X 2 são variáveis ​​aleatórias geométricas independentes com probabilidade de sucesso p 1 e p 2 respectivamente, então min ( X 1 , X 2 ) é uma variável aleatória geométrica com probabilidade de sucesso p = p 1 + p 2 - p 1 p 2 . A relação é mais simples se expressa em termos de probabilidade de falha: q = q 1 q 2 .
  • Se X 1 e X 2 são variáveis ​​aleatórias exponenciais independentes com taxa μ 1 e μ 2 respectivamente, então min ( X 1 , X 2 ) é uma variável aleatória exponencial com taxa μ = μ 1 + μ 2 .

Da mesma forma, as distribuições para as quais o valor máximo de várias variáveis ​​aleatórias independentes é membro da mesma família de distribuição incluem: distribuição de Bernoulli , distribuição da lei de potência .

De outros

  • Se X e Y são variáveis ​​aleatórias normais padrão independentes , X / Y é uma variável aleatória de Cauchy (0,1).
  • Se X 1 e X 2 são variáveis ​​aleatórias qui-quadradas independentes com ν 1 e ν 2 graus de liberdade respectivamente, então ( X 1 / ν 1 ) / ( X 2 / ν 2 ) é um F ( ν 1 , ν 2 ) variável aleatória.
  • Se X é uma variável aleatória normal padrão e U é uma variável aleatória qui-quadrada independente com ν graus de liberdade, então é uma variável aleatória t ( ν ) de Student .
  • Se X 1 é uma variável aleatória gama ( α 1 , 1) e X 2 é uma variável aleatória gama independente (α 2 , 1), então X 1 / ( X 1 + X 2 ) é um beta ( α 1 , α 2 ) variável aleatória. Mais geralmente, se X 1 é uma variável aleatória gama ( α 1 , β 1 ) e X 2 é uma variável aleatória gama independente ( α 2 , β 2 ), então β 2 X 1 / ( β 2 X 1 + β 1 X 2 ) é uma variável aleatória beta ( α 1 , α 2 ).
  • Se X e Y são variáveis ​​aleatórias exponenciais independentes com média μ, então X  -  Y é uma variável aleatória exponencial dupla com média 0 e escala μ.
  • Se X i são variáveis ​​aleatórias de Bernoulli independentes, então sua paridade (XOR) é uma variável de Bernoulli descrita pelo lema de empilhamento .

(Veja também distribuição de proporção .)

Relações aproximadas (limite)

Meios de relacionamento aproximados ou limitados

  • ou que a combinação de um número infinito de variáveis aleatórias iid tende a alguma distribuição,
  • ou que o limite quando um parâmetro tende a algum valor se aproxima de uma distribuição diferente.

Combinação de variáveis aleatórias iid :

  • Dadas certas condições, a soma (daí a média) de um número suficientemente grande de variáveis ​​aleatórias iid, cada uma com média e variância finitas, será distribuída aproximadamente normalmente. Este é o teorema do limite central (CLT).

Caso especial de parametrização de distribuição:

  • X é uma variável aleatória hipergeométrica ( m , N , n ). Se n e m são grandes em comparação com N e p = m / N não é próximo de 0 ou 1, então X tem aproximadamente uma distribuição Binomial ( n , p ).
  • X é uma variável aleatória beta-binomial com parâmetros ( n , α , β ). Seja p = α / ( α + β ) e suponha que α + β seja grande, então X tem aproximadamente uma distribuição binomial ( n , p ).
  • Se X for uma variável aleatória binomial ( n , p ) e se n for grande e np for pequeno, então X terá aproximadamente uma distribuição de Poisson ( np ).
  • Se X for uma variável aleatória binomial negativa com r grande, P próximo a 1 e r (1 -  P ) = λ , então X terá aproximadamente uma distribuição de Poisson com média λ .

Consequências da CLT:

  • Se X for uma variável aleatória de Poisson com grande média, então para inteiros j e k , P ( jXk ) aproximadamente igual a P ( j - 1/2 ≤ Yk + 1/2) onde Y é um normal distribuição com a mesma média e variância como X .
  • Se X for uma variável aleatória binomial ( n , p ) com grandes np e n (1 -  p ), então para inteiros j e k , P ( jXk ) aproximadamente igual a P ( j - 1/2 ≤ Yk + 1/2) onde Y é uma variável aleatória normal com a mesma média e variância de X , ou seja, np e np (1 -  p ).
  • Se X é uma variável beta aleatória com parâmetros α e β iguais e grandes, então X tem aproximadamente uma distribuição normal com a mesma média e variância, ou seja, média α / ( α + β ) e variância αβ / (( α + β ) 2 ( α + β + 1)).
  • Se X for uma variável aleatória gama ( α , β ) e o parâmetro de forma α for grande em relação ao parâmetro de escala β , então X terá aproximadamente uma variável aleatória normal com a mesma média e variância.
  • Se X for uma variável aleatória t de Student com um grande número de graus de liberdade ν, então X terá aproximadamente uma distribuição normal padrão .
  • Se X for uma variável aleatória F ( ν , ω ) com ω grande, então νX é aproximadamente distribuída como uma variável aleatória qui-quadrada com ν graus de liberdade.

Relações compostas (ou bayesianas)

Quando um ou mais parâmetro (s) de uma distribuição são variáveis ​​aleatórias, a distribuição composta é a distribuição marginal da variável.

Exemplos:

  • Se X  | N é uma variável aleatória binomial ( N , p ), onde o parâmetro N é uma variável aleatória com distribuição binomial negativa ( m , r ), então X é distribuído como binomial negativo ( m , r / ( p + qr )) .
  • Se X  | N é uma variável aleatória binomial ( N , p ), onde o parâmetro N é uma variável aleatória com distribuição de Poisson ( μ ), então X é distribuído como Poisson ( μp ).
  • Se X  | μ é uma variável aleatória Poisson ( μ ) e o parâmetro μ é uma variável aleatória com distribuição gama ( m , θ ) (onde θ é o parâmetro de escala), então X é distribuído como um binômio negativo ( m , θ / (1 +  θ) )), às vezes chamada de distribuição gama-Poisson .

Algumas distribuições foram especialmente nomeadas como compostos: distribuição beta-binomial , distribuição beta-Pascal , distribuição gama-normal .

Exemplos:

  • Se X é uma variável aleatória Binomial ( n , p ) e o parâmetro p é uma variável aleatória com distribuição beta ( α , β ), então X é distribuído como um Beta-Binomial ( α , β , n ).
  • Se X é uma variável aleatória binomial negativa ( m , p ) e o parâmetro p é uma variável aleatória com distribuição beta ( α , β ), então X é distribuído como um Beta-Pascal ( α , β , m ).

Veja também

Referências

links externos