Independência condicional - Conditional independence

Na teoria da probabilidade , a independência condicional descreve situações em que uma observação é irrelevante ou redundante ao avaliar a certeza de uma hipótese. A independência condicional é geralmente formulada em termos de probabilidade condicional , como um caso especial em que a probabilidade da hipótese dada a observação não informativa é igual à probabilidade sem. Se for a hipótese, e e forem observações, a independência condicional pode ser declarada como uma igualdade:

onde é a probabilidade de dado e . Visto que a probabilidade de dado é a mesma que a probabilidade de dado ambos e , essa igualdade expressa que nada contribui para a certeza de . Neste caso, e são disse a ser condicionalmente independentes dado , escrito simbolicamente como: .

O conceito de independência condicional é essencial para as teorias de inferência estatística baseadas em gráficos, pois estabelece uma relação matemática entre uma coleção de declarações condicionais e um grafóide .

Independência Condicional de Eventos

Let , e be eventos . e são considerados condicionalmente independentes, dados se e somente se e:

Esta propriedade é muitas vezes escrito: .

De forma equivalente, a independência condicional pode ser declarada como:

onde é a probabilidade conjunta de e fornecida . Esta formulação alternativa afirma que e são eventos independentes , dados .

Prova da definição equivalente

iff      (definição de probabilidade condicional )
iff       (multiplique ambos os lados por )
iff       (divida os dois lados por )
iff       (definição de probabilidade condicional)

Exemplos

A discussão no StackExchange fornece alguns exemplos úteis. Veja abaixo.

Caixas coloridas

Cada célula representa um resultado possível. Os eventos , e são representadas pelas áreas sombreadas vermelho , azul e amarelo , respectivamente. A sobreposição entre os eventos e está sombreada em roxo .

Estes são dois exemplos que ilustram a independência condicional.

As probabilidades desses eventos são áreas sombreadas em relação à área total. Em ambos os exemplos e são condicionalmente independentes, dados porque:

mas não condicionalmente independente dado porque:

Tempo e atrasos

Sejam os dois eventos as probabilidades das pessoas A e B chegarem em casa a tempo para o jantar, e o terceiro evento é o fato de que uma tempestade de neve atingiu a cidade. Embora A e B tenham uma probabilidade menor de chegar em casa a tempo para o jantar, as probabilidades mais baixas ainda serão independentes uma da outra. Ou seja, saber que A está atrasado não indica se B chegará atrasado. (Eles podem estar morando em bairros diferentes, viajando distâncias diferentes e usando meios de transporte diferentes.) No entanto, se você tiver informações de que eles moram no mesmo bairro, use o mesmo meio de transporte e trabalhem no mesmo lugar, então os dois eventos NÃO são condicionalmente independentes.

Dados rolando

A independência condicional depende da natureza do terceiro evento. Se você lançar dois dados, pode-se presumir que os dois dados se comportam independentemente um do outro. Olhar para os resultados de um dado não dirá sobre o resultado do segundo dado. (Ou seja, os dois dados são independentes.) Se, no entanto, o resultado do primeiro dado for 3, e alguém lhe contar sobre um terceiro evento - que a soma dos dois resultados é par - então esta unidade extra de informação restringe o opções do 2º resultado para um número ímpar. Em outras palavras, dois eventos podem ser independentes, mas NÃO condicionalmente independentes.

Altura e vocabulário

A altura e o vocabulário são dependentes, pois pessoas muito pequenas tendem a ser crianças, conhecidas por seus vocabulários mais básicos. Mas, sabendo que duas pessoas têm 19 anos (ou seja, com base na idade), não há razão para pensar que o vocabulário de uma pessoa é maior se nos dizem que ela é mais alta.

Independência condicional de variáveis ​​aleatórias

Duas variáveis ​​aleatórias e são condicionalmente independentes, dada uma terceira variável aleatória discreta, se e somente se elas forem independentes em sua distribuição de probabilidade condicional dada . Isto é, e são condicionalmente independentes, dados se e somente se, dado qualquer valor de , a distribuição de probabilidade de for a mesma para todos os valores de e a distribuição de probabilidade de for a mesma para todos os valores de . Formalmente:

 

 

 

 

( Eq.2 )

onde é a função de distribuição cumulativa condicional de e fornecida .

Dois eventos e são condicionalmente independentes, dada uma σ-álgebra se

onde indica a esperança condicional da função do indicador do evento , , dada a álgebra sigma . Isso é,

Duas variáveis aleatórias e são condicionalmente independentes dado um σ-álgebra se a equação acima é válido para todos no e no .

Duas variáveis ​​aleatórias e são condicionalmente independentes, dada uma variável aleatória, se forem independentes, dado σ ( W ): a σ-álgebra gerada por . Isto é comumente escrito:

ou

Isso é lido como " é independente de , dado "; o condicionamento se aplica a toda a afirmação: "( é independente de ) dado ".

Se assume um conjunto de valores contáveis, isso é equivalente à independência condicional de X e Y para os eventos do formulário . A independência condicional de mais de dois eventos, ou de mais de duas variáveis ​​aleatórias, é definida analogamente.

Os dois exemplos a seguir mostram que nem implica nem está implícito por . Primeiro, suponha que seja 0 com probabilidade 0,5 e 1 caso contrário. Quando W  = 0 tome e seja independente, cada um tendo o valor 0 com probabilidade de 0,99 e o valor 1 em caso contrário. Quando , e são novamente independentes, mas desta vez assumem o valor 1 com probabilidade de 0,99. Então . Mas e são dependentes, porque Pr ( X  = 0) <Pr ( X  = 0 | Y  = 0). Isso ocorre porque Pr ( X  = 0) = 0,5, mas se Y  = 0, então é muito provável que W  = 0 e, portanto, que X  = 0 também, então Pr ( X  = 0 | Y  = 0)> 0,5. Para o segundo exemplo, suponha , cada um tomando os valores 0 e 1 com probabilidade de 0,5. Deixe ser o produto . Então , quando Pr ( X  = 0) = 2/3, mas Pr ( X  = 0 | Y  = 0) = 1/2, então é falso. Este também é um exemplo de explicação. Veja o tutorial de Kevin Murphy onde e tome os valores "inteligente" e "esportivo".

Independência condicional de vetores aleatórios

Dois vetores aleatórios e são condicionalmente independentes dado um terceiro vetor aleatório se e somente se eles são independentes na sua distribuição cumulativa condicional dada . Formalmente:

 

 

 

 

( Eq.3 )

onde , e e as distribuições cumulativas condicionais são definidos como se segue.

Usos na inferência bayesiana

Seja p a proporção de eleitores que votarão "sim" em um próximo referendo . Ao fazer uma pesquisa de opinião , escolhe-se n eleitores aleatoriamente da população. Para i  = 1, ...,  n , vamos X i  = 1 ou 0 correspondente, respectivamente, para se ou não o i th eleitor escolhido vai ou não vai votar "sim".

Em uma abordagem frequentista de inferência estatística , não se atribuiria nenhuma distribuição de probabilidade a p (a menos que as probabilidades pudessem ser de alguma forma interpretadas como frequências relativas de ocorrência de algum evento ou como proporções de alguma população) e dir-se-ia que X 1 , ..., X n são variáveis ​​aleatórias independentes .

Por outro lado, em uma abordagem bayesiana para inferência estatística, alguém atribuiria uma distribuição de probabilidade a p, independentemente da não existência de qualquer interpretação de "frequência", e seria interpretado as probabilidades como graus de crença de que p está em qualquer intervalo de ao qual uma probabilidade é atribuída. Nesse modelo, as variáveis ​​aleatórias X 1 , ...,  X n não são independentes, mas são condicionalmente independentes dado o valor de p . Em particular, se um grande número de X s é observado como sendo igual a 1, isso implicaria em uma alta probabilidade condicional , dada essa observação, que p é próximo de 1 e, portanto, uma alta probabilidade condicional , dada essa observação, que o o próximo X a ser observado será igual a 1.

Regras de independência condicional

Um conjunto de regras que regem as declarações de independência condicional foi derivado da definição básica.

Essas regras foram denominadas " Axiomas Graphoid " por Pearl e Paz, porque se prendem em gráficos, onde é interpretado como significando: "Todos os caminhos de X a A são interceptados pelo conjunto B ".

Simetria

Decomposição

Prova

  •      (significado de )
  •      (ignore a variável B integrando-a)
  •     

Uma prova espectáculos semelhantes a independência de X e B .

União fraca

Prova

  • Por suposição ,.
  • Devido à propriedade de decomposição , .
  • Combinando as duas igualdades acima dá , o que estabelece .

A segunda condição pode ser provada de forma semelhante.

Contração

Prova

Esta propriedade pode ser provada observando , cada igualdade da qual é afirmada por e , respectivamente.

Interseção

Para distribuições de probabilidade estritamente positivas, o seguinte também é válido:

Prova

Por suposição:

Usando esta igualdade, juntamente com a Lei da probabilidade total aplicada a :

Desde e , segue-se isso .


Nota técnica: uma vez que estas implicações segurar para qualquer espaço de probabilidade, eles ainda irá realizar se se considera um sub-universo pelo condicionamento tudo em outra variável, digamos  K . Por exemplo, também significaria isso .

Veja também

Referências

links externos