Jeffreys anterior - Jeffreys prior

Na probabilidade bayesiana , o prior de Jeffreys , em homenagem a Sir Harold Jeffreys , é uma distribuição a priori não informativa (objetiva) para um espaço de parâmetros; a sua função de densidade é proporcional à raiz quadrada do determinante da informação de Fisher matriz:

Ele tem a característica principal de ser invariável sob uma mudança de coordenadas para o vetor de parâmetro . Ou seja, a probabilidade relativa atribuída a um volume de um espaço de probabilidade usando um Jeffreys prior será a mesma, independentemente da parametrização usada para definir o Jeffreys prior. Isso o torna de especial interesse para uso com parâmetros de escala .

Reparameterização

Caso de um parâmetro

Se e são duas parametrizações possíveis de um modelo estatístico, e é uma função continuamente diferenciável de , dizemos que o prior é "invariante" sob uma reparametrização se

isto é, se os antecedentes e estão relacionados pelo teorema usual da mudança de variáveis .

Uma vez que a informação de Fisher se transforma sob reparametrização como

definir os antecedentes como e nos dá a "invariância" desejada.

Caso de múltiplos parâmetros

Analogamente ao caso de um parâmetro, sejam e sejam duas parametrizações possíveis de um modelo estatístico, com uma função continuamente diferenciável de . Chamamos o anterior de "invariante" em reparametrização se

onde está a matriz Jacobiana com entradas

Uma vez que a matriz de informação de Fisher se transforma sob reparametrização como

nós temos isso

e, assim, definir os antecedentes como e nos dá a "invariância" desejada.

Atributos

Do ponto de vista prático e matemático, uma razão válida para usar este prior não informativo em vez de outros, como os obtidos através de um limite em famílias conjugadas de distribuições, é que a probabilidade relativa de um volume do espaço de probabilidade não depende de o conjunto de variáveis ​​de parâmetro que é escolhido para descrever o espaço de parâmetro.

Às vezes, o prior de Jeffreys não pode ser normalizado e, portanto, é um prior impróprio . Por exemplo, a prioridade de Jeffreys para a média de distribuição é uniforme em toda a linha real no caso de uma distribuição gaussiana de variância conhecida.

O uso do prior de Jeffreys viola a versão forte do princípio da verossimilhança , que é aceito por muitos, mas não por todos, estatísticos. Ao usar o Jeffreys anterior, as inferências sobre dependem não apenas da probabilidade dos dados observados em função de , mas também do universo de todos os resultados experimentais possíveis, conforme determinado pelo projeto experimental, porque a informação de Fisher é calculada a partir de uma expectativa sobre o universo escolhido. Consequentemente, o anterior de Jeffreys e, portanto, as inferências feitas com ele, podem ser diferentes para dois experimentos envolvendo o mesmo parâmetro, mesmo quando as funções de verossimilhança para os dois experimentos são as mesmas - uma violação do princípio de alta verossimilhança.

Comprimento mínimo da descrição

Na abordagem de comprimento de descrição mínimo para estatísticas, o objetivo é descrever os dados da forma mais compacta possível, onde o comprimento de uma descrição é medido em bits do código usado. Para uma família paramétrica de distribuições, compara-se um código com o melhor código com base em uma das distribuições da família parametrizada. O principal resultado é que em famílias exponenciais , assintoticamente para grandes tamanhos de amostra, o código baseado na distribuição que é uma mistura dos elementos da família exponencial com a anterior de Jeffreys é ideal. Este resultado é válido se restringirmos o conjunto de parâmetros a um subconjunto compacto no interior de todo o espaço de parâmetros. Se o parâmetro completo for usado, uma versão modificada do resultado deve ser usada.

Exemplos

A prioridade de Jeffreys para um parâmetro (ou um conjunto de parâmetros) depende do modelo estatístico.

Distribuição Gaussiana com parâmetro médio

Para a distribuição gaussiana do valor real

com fixo, o Jeffreys anterior para a média é

Ou seja, o prior de Jeffreys para não depende ; é a distribuição uniforme não normalizada na linha real - a distribuição que é 1 (ou alguma outra constante fixa) para todos os pontos. Este é um prévio impróprio , e é, até a escolha da constante, a única distribuição -invariante de translação nos reais (a medida de Haar em relação à adição de reais), correspondendo à média sendo uma medida de localização e invariância de translação correspondendo a nenhuma informação sobre a localização.

Distribuição Gaussiana com parâmetro de desvio padrão

Para a distribuição gaussiana do valor real

com fixo, o Jeffreys anterior para o desvio padrão é

Equivalentemente, o prior de Jeffreys para é a distribuição uniforme não normalizada na linha real e, portanto, essa distribuição também é conhecida como anterior logarítmico . Da mesma forma, o prior de Jeffreys paratambém é uniforme. É o único (até um múltiplo) anterior (nos reais positivos) que évariável deescala(amedida de Haarem relação à multiplicação de reais positivos), correspondendo ao desvio padrão sendo uma medida deescalae invariância de escala correspondente a nenhuma informação sobre a escala. Tal como acontece com a distribuição uniforme nos reais, é umprior impróprio.

Distribuição de Poisson com parâmetro de taxa

Para a distribuição de Poisson do número inteiro não negativo ,

o Jeffreys anterior para o parâmetro de taxa é

De forma equivalente, a prioridade de Jeffreys para é a distribuição uniforme não normalizada na linha real não negativa.

Julgamento de Bernoulli

Para uma moeda que é "cara" com probabilidade e "coroa" com probabilidade , para um dado a probabilidade é . O Jeffreys anterior para o parâmetro é

Esta é a distribuição arco - seno e é uma distribuição beta com . Além disso, se então

Ou seja, o prior de Jeffreys para é uniforme no intervalo . Equivalentemente, é uniforme em todo o círculo .

Dado de N lados com probabilidades tendenciosas

Da mesma forma, para o lançamento de um dado lateral com probabilidades de resultado , cada um não negativo e satisfatório , o Jeffreys anterior para é a distribuição de Dirichlet com todos os parâmetros (alfa) definidos para a metade. Isso equivale a usar uma pseudocontagem de metade para cada resultado possível.

Equivalentemente, se escrevermos para cada um , então a prioridade de Jeffreys para é uniforme na esfera unitária ( N  - 1) dimensional ( ou seja , é uniforme na superfície de uma esfera unitária N- dimensional ).

Referências

Leitura adicional