Jeffreys anterior - Jeffreys prior
Na probabilidade bayesiana , o prior de Jeffreys , em homenagem a Sir Harold Jeffreys , é uma distribuição a priori não informativa (objetiva) para um espaço de parâmetros; a sua função de densidade é proporcional à raiz quadrada do determinante da informação de Fisher matriz:
Ele tem a característica principal de ser invariável sob uma mudança de coordenadas para o vetor de parâmetro . Ou seja, a probabilidade relativa atribuída a um volume de um espaço de probabilidade usando um Jeffreys prior será a mesma, independentemente da parametrização usada para definir o Jeffreys prior. Isso o torna de especial interesse para uso com parâmetros de escala .
Reparameterização
Caso de um parâmetro
Se e são duas parametrizações possíveis de um modelo estatístico, e é uma função continuamente diferenciável de , dizemos que o prior é "invariante" sob uma reparametrização se
isto é, se os antecedentes e estão relacionados pelo teorema usual da mudança de variáveis .
Uma vez que a informação de Fisher se transforma sob reparametrização como
definir os antecedentes como e nos dá a "invariância" desejada.
Caso de múltiplos parâmetros
Analogamente ao caso de um parâmetro, sejam e sejam duas parametrizações possíveis de um modelo estatístico, com uma função continuamente diferenciável de . Chamamos o anterior de "invariante" em reparametrização se
onde está a matriz Jacobiana com entradas
Uma vez que a matriz de informação de Fisher se transforma sob reparametrização como
nós temos isso
e, assim, definir os antecedentes como e nos dá a "invariância" desejada.
Atributos
Do ponto de vista prático e matemático, uma razão válida para usar este prior não informativo em vez de outros, como os obtidos através de um limite em famílias conjugadas de distribuições, é que a probabilidade relativa de um volume do espaço de probabilidade não depende de o conjunto de variáveis de parâmetro que é escolhido para descrever o espaço de parâmetro.
Às vezes, o prior de Jeffreys não pode ser normalizado e, portanto, é um prior impróprio . Por exemplo, a prioridade de Jeffreys para a média de distribuição é uniforme em toda a linha real no caso de uma distribuição gaussiana de variância conhecida.
O uso do prior de Jeffreys viola a versão forte do princípio da verossimilhança , que é aceito por muitos, mas não por todos, estatísticos. Ao usar o Jeffreys anterior, as inferências sobre dependem não apenas da probabilidade dos dados observados em função de , mas também do universo de todos os resultados experimentais possíveis, conforme determinado pelo projeto experimental, porque a informação de Fisher é calculada a partir de uma expectativa sobre o universo escolhido. Consequentemente, o anterior de Jeffreys e, portanto, as inferências feitas com ele, podem ser diferentes para dois experimentos envolvendo o mesmo parâmetro, mesmo quando as funções de verossimilhança para os dois experimentos são as mesmas - uma violação do princípio de alta verossimilhança.
Comprimento mínimo da descrição
Na abordagem de comprimento de descrição mínimo para estatísticas, o objetivo é descrever os dados da forma mais compacta possível, onde o comprimento de uma descrição é medido em bits do código usado. Para uma família paramétrica de distribuições, compara-se um código com o melhor código com base em uma das distribuições da família parametrizada. O principal resultado é que em famílias exponenciais , assintoticamente para grandes tamanhos de amostra, o código baseado na distribuição que é uma mistura dos elementos da família exponencial com a anterior de Jeffreys é ideal. Este resultado é válido se restringirmos o conjunto de parâmetros a um subconjunto compacto no interior de todo o espaço de parâmetros. Se o parâmetro completo for usado, uma versão modificada do resultado deve ser usada.
Exemplos
A prioridade de Jeffreys para um parâmetro (ou um conjunto de parâmetros) depende do modelo estatístico.
Distribuição Gaussiana com parâmetro médio
Para a distribuição gaussiana do valor real
com fixo, o Jeffreys anterior para a média é
Ou seja, o prior de Jeffreys para não depende ; é a distribuição uniforme não normalizada na linha real - a distribuição que é 1 (ou alguma outra constante fixa) para todos os pontos. Este é um prévio impróprio , e é, até a escolha da constante, a única distribuição -invariante de translação nos reais (a medida de Haar em relação à adição de reais), correspondendo à média sendo uma medida de localização e invariância de translação correspondendo a nenhuma informação sobre a localização.
Distribuição Gaussiana com parâmetro de desvio padrão
Para a distribuição gaussiana do valor real
com fixo, o Jeffreys anterior para o desvio padrão é
Equivalentemente, o prior de Jeffreys para é a distribuição uniforme não normalizada na linha real e, portanto, essa distribuição também é conhecida como anterior logarítmico . Da mesma forma, o prior de Jeffreys paratambém é uniforme. É o único (até um múltiplo) anterior (nos reais positivos) que évariável deescala(amedida de Haarem relação à multiplicação de reais positivos), correspondendo ao desvio padrão sendo uma medida deescalae invariância de escala correspondente a nenhuma informação sobre a escala. Tal como acontece com a distribuição uniforme nos reais, é umprior impróprio.
Distribuição de Poisson com parâmetro de taxa
Para a distribuição de Poisson do número inteiro não negativo ,
o Jeffreys anterior para o parâmetro de taxa é
De forma equivalente, a prioridade de Jeffreys para é a distribuição uniforme não normalizada na linha real não negativa.
Julgamento de Bernoulli
Para uma moeda que é "cara" com probabilidade e "coroa" com probabilidade , para um dado a probabilidade é . O Jeffreys anterior para o parâmetro é
Esta é a distribuição arco - seno e é uma distribuição beta com . Além disso, se então
Ou seja, o prior de Jeffreys para é uniforme no intervalo . Equivalentemente, é uniforme em todo o círculo .
Dado de N lados com probabilidades tendenciosas
Da mesma forma, para o lançamento de um dado lateral com probabilidades de resultado , cada um não negativo e satisfatório , o Jeffreys anterior para é a distribuição de Dirichlet com todos os parâmetros (alfa) definidos para a metade. Isso equivale a usar uma pseudocontagem de metade para cada resultado possível.
Equivalentemente, se escrevermos para cada um , então a prioridade de Jeffreys para é uniforme na esfera unitária ( N - 1) dimensional ( ou seja , é uniforme na superfície de uma esfera unitária N- dimensional ).
Referências
Leitura adicional
- Jeffreys, H. (1946). "Uma forma invariável para a probabilidade prévia em problemas de estimativa" . Proceedings of the Royal Society of London. Série A, Ciências Matemáticas e Físicas . 186 (1007): 453–461. doi : 10.1098 / rspa.1946.0056 . JSTOR 97883 . PMID 20998741 .
- Jeffreys, H. (1939). Teoria da Probabilidade . Imprensa da Universidade de Oxford.
- Kass, Robert E .; Wasserman, Larry (1996). "A Seleção de Distribuições Prévias por Regras Formais". Journal of the American Statistical Association . 91 (435): 1343–1370. doi : 10.1080 / 01621459.1996.10477003 .