Distribuição normal generalizada - Generalized normal distribution

A distribuição normal generalizada ou distribuição Gaussiana generalizada (GGD) é uma das duas famílias de distribuições de probabilidade contínuas paramétricas na linha real . Ambas as famílias adicionam um parâmetro de forma à distribuição normal . Para distinguir as duas famílias, são referidas a seguir como "versão 1" e "versão 2". No entanto, esta não é uma nomenclatura padrão.

Versão 1

Normal generalizado (versão 1)
Função densidade de probabilidade
Gráficos de densidade de probabilidade de distribuições normais generalizadas
Função de distribuição cumulativa
Gráficos de função de distribuição cumulativa de distribuições normais generalizadas
Parâmetros localização ( real ) escala (positiva, real ) forma (positiva, real )

Apoio, suporte
PDF



denota a função gama
CDF

onde é um parâmetro de forma e é um parâmetro de taxa.

onde é um parâmetro de forma, é um parâmetro de escala e é a função gama inferior incompleta não normalizada .
Quantil


onde está a função quantil da distribuição Gama
Quer dizer
Mediana
Modo
Variância
Skewness 0
Ex. curtose
Entropia

Conhecida também como distribuição de potência exponencial ou distribuição de erro generalizada , esta é uma família paramétrica de distribuições simétricas. Inclui todas as distribuições normais e de Laplace e , como casos limites, inclui todas as distribuições uniformes contínuas em intervalos limitados da linha real.

Esta família inclui a distribuição normal quando (com média e variância ) e inclui a distribuição de Laplace quando . Como , a densidade converge pointwise para uma densidade uniforme em .

Esta família permite caudas mais pesadas que o normal (quando ) ou mais leves que o normal (quando ). É uma maneira útil de parametrizar um continuum de densidades simétricas platicúrticas que vão da densidade normal ( ) à uniforme ( ), e um continuum de densidades leptocúrticas simétricas que vão de Laplace ( ) à densidade normal ( ).

Estimativa de parâmetro

A estimativa dos parâmetros via máxima verossimilhança e o método dos momentos foram estudados. As estimativas não têm forma fechada e devem ser obtidas numericamente. Estimadores que não requerem cálculo numérico também foram propostos.

A função log-verossimilhança normal generalizada tem infinitamente muitas derivadas contínuas (isto é, pertence à classe C das funções suaves ) apenas se for um número inteiro positivo e uniforme. Caso contrário, a função tem derivadas contínuas. Como resultado, os resultados padrão para consistência e normalidade assintótica das estimativas de máxima verossimilhança aplicam-se apenas quando .

Estimador de máxima verossimilhança

É possível ajustar a distribuição normal generalizada adotando um método de máxima verossimilhança aproximada . Com inicialmente definido para o primeiro momento da amostra , é estimado usando um procedimento iterativo de Newton-Raphson , começando de uma estimativa inicial de ,

Onde

é o primeiro momento estatístico dos valores absolutos e é o segundo momento estatístico . A iteração é

Onde

e

e onde e estão a função digamma e a função trigamma .

Dado um valor para , é possível estimar encontrando o mínimo de:

Finalmente é avaliado como

Pois , mediana é um estimador mais apropriado de . Uma vez é estimado e pode ser estimado conforme descrito acima.

Formulários

Esta versão da distribuição normal generalizada tem sido usada na modelagem quando a concentração de valores em torno da média e o comportamento da cauda são de particular interesse. Outras famílias de distribuições podem ser usadas se o foco estiver em outros desvios da normalidade. Se a simetria da distribuição for o interesse principal, a família normal de inclinação ou a versão 2 da família normal generalizada discutida abaixo pode ser usada. Se o comportamento da cauda for o principal interesse, a família t student pode ser usada, que se aproxima da distribuição normal conforme os graus de liberdade crescem até o infinito. A distribuição t, ao contrário desta distribuição normal generalizada, obtém caudas mais pesadas do que as normais, sem adquirir uma cúspide na origem.

Propriedades

Momentos

Let be zero média distribuição Gaussiana generalizada de forma e parâmetro de escala . Os momentos de existem e são finitos para qualquer k maior que -1. Para qualquer número inteiro não negativo k, os momentos centrais simples são


Conexão com a distribuição de contagem estável

Do ponto de vista da distribuição da contagem Estável , pode ser considerado o parâmetro de estabilidade de Lévy. Esta distribuição pode ser decomposta em uma integral da densidade do kernel, onde o kernel é uma distribuição Laplace ou uma distribuição Gaussiana :

onde é a distribuição de contagem Estável e é a distribuição de volume Estável .

Conexão com funções positivas definidas

A função de densidade de probabilidade desta versão da distribuição normal generalizada é uma função definida positiva para .

Divisibilidade infinita

Esta versão da distribuição gaussiana generalizada é uma distribuição infinitamente divisível se e somente se .

Generalizações

A distribuição normal generalizada multivariada, ou seja, o produto das distribuições de potência exponencial com os mesmos parâmetros e , é a única densidade de probabilidade que pode ser escrita na forma e tem marginais independentes. Os resultados para o caso especial da distribuição normal multivariada são originalmente atribuídos a Maxwell .

Versão 2

Normal generalizado (versão 2)
Função densidade de probabilidade
Gráficos de densidade de probabilidade de distribuições normais generalizadas
Função de distribuição cumulativa
Gráficos de função de distribuição cumulativa de distribuições normais generalizadas
Parâmetros local ( reais ) escala (positiva, verdadeira ) forma ( verdadeiro )

Apoio, suporte

PDF , onde está o pdf normal padrão

CDF , onde está o CDF normal padrão

Quer dizer
Mediana
Variância
Skewness
Ex. curtose

Esta é uma família de distribuições de probabilidade contínuas em que o parâmetro de forma pode ser usado para introduzir inclinação. Quando o parâmetro de forma é zero, o resultado é a distribuição normal. Os valores positivos do parâmetro de forma geram distribuições distorcidas para a esquerda limitadas à direita e os valores negativos do parâmetro de forma geram distribuições distorcidas para a direita limitadas à esquerda. Somente quando o parâmetro de forma é zero é que a função de densidade para esta distribuição é positiva ao longo de toda a linha real: neste caso, a distribuição é uma distribuição normal , caso contrário, as distribuições são deslocadas e, possivelmente, distribuições log-normais invertidas .

Estimativa de parâmetro

Os parâmetros podem ser estimados por meio da estimativa de máxima verossimilhança ou do método dos momentos. As estimativas dos parâmetros não têm uma forma fechada, portanto, cálculos numéricos devem ser usados ​​para computar as estimativas. Visto que o espaço amostral (o conjunto de números reais onde a densidade é diferente de zero) depende do valor verdadeiro do parâmetro, alguns resultados padrão sobre o desempenho das estimativas de parâmetro não se aplicam automaticamente ao trabalhar com esta família.

Formulários

Esta família de distribuições pode ser usada para modelar valores que podem ser normalmente distribuídos ou que podem ser inclinados para a direita ou para a esquerda em relação à distribuição normal. A distribuição normal de inclinação é outra distribuição útil para modelar desvios da normalidade devido à inclinação. Outras distribuições usadas para modelar dados distorcidos incluem as distribuições gama , lognormal e Weibull , mas não incluem as distribuições normais como casos especiais.

Outras distribuições relacionadas ao normal

As duas famílias normais generalizadas descritas aqui, como a família normal de inclinação , são famílias paramétricas que estendem a distribuição normal adicionando um parâmetro de forma. Devido ao papel central da distribuição normal em probabilidade e estatística, muitas distribuições podem ser caracterizadas em termos de sua relação com a distribuição normal. Por exemplo, as distribuições log-normal , normal dobrada e normal inversa são definidas como transformações de um valor normalmente distribuído, mas ao contrário das famílias normal generalizada e normal inclinada, estas não incluem as distribuições normais como casos especiais.
Na verdade, todas as distribuições com variância finita estão no limite altamente relacionadas à distribuição normal. A distribuição Student-t, a distribuição Irwin-Hall e a distribuição Bates também estendem a distribuição normal e incluem no limite a distribuição normal. Portanto, não há nenhuma razão forte para preferir a distribuição normal "generalizada" do tipo 1, por exemplo, em vez de uma combinação de Student-t e um Irwin-Hall estendido normalizado - isso incluiria, por exemplo, a distribuição triangular (que não pode ser modelada pelo Gaussiano generalizado tipo 1).
Uma distribuição simétrica que pode modelar a cauda (longa e curta) e o comportamento do centro (como plano, triangular ou gaussiano) de forma completamente independente pode ser derivada, por exemplo, usando  X  = IH / chi.

Veja também

Referências