Distribuição log-logística - Log-logistic distribution

Logística
Função densidade de probabilidade
Loglogisticpdf.svg
valores de como mostrado na legenda
Função de distribuição cumulativa
Loglogisticcdf.svg
valores de como mostrado na legenda
Parâmetros forma de escala
Apoiar
PDF
CDF
Mau
se , senão indefinido
Mediana
Modo
se , 0 caso contrário
Variância Veja o texto principal
MGF onde está a função Beta .
CF onde está a função Beta .

Em probabilidade e estatística , a distribuição log-logística (conhecida como distribuição Fisk em economia ) é uma distribuição de probabilidade contínua para uma variável aleatória não negativa . É utilizado na análise de sobrevida como modelo paramétrico para eventos cuja taxa aumenta inicialmente e diminui posteriormente, como, por exemplo, taxa de mortalidade por câncer após diagnóstico ou tratamento. Também tem sido usado na hidrologia para modelar o fluxo e precipitação dos rios , na economia como um modelo simples de distribuição de riqueza ou renda e em redes para modelar os tempos de transmissão de dados considerando tanto a rede quanto o software.

A distribuição log-logística é a distribuição de probabilidade de uma variável aleatória cujo logaritmo tem uma distribuição logística . É semelhante em formato à distribuição log-normal, mas tem caudas mais pesadas . Ao contrário do log-normal, sua função de distribuição cumulativa pode ser escrita de forma fechada .

Caracterização

Existem várias parametrizações diferentes da distribuição em uso. O mostrado aqui fornece parâmetros razoavelmente interpretáveis ​​e uma forma simples para a função de distribuição cumulativa . O parâmetro é um parâmetro de escala e também é a mediana da distribuição. O parâmetro é um parâmetro de forma . A distribuição é unimodal quando e sua dispersão diminui à medida que aumenta.

A função de distribuição cumulativa é

onde , ,

A função de densidade de probabilidade é

Parametrização alternativa

Uma parametrização alternativa é dada pelo par em analogia com a distribuição logística:

Propriedades

Momentos

O primeiro momento bruto existe apenas quando é dado por

onde B é a função beta . Expressões para a média , variância , assimetria e curtose podem ser derivadas disso. Escrevendo por conveniência, o meio é

e a variação é

As expressões explícitas para a assimetria e curtose são longas. Como tende para o infinito, a média tende para , a variância e a assimetria tendem a zero e o excesso de curtose tende a 6/5 (ver também distribuições relacionadas abaixo).

Quantil

A função quantil (função de distribuição cumulativa inversa) é:

Conclui-se que a mediana é , o quartil inferior é e o quartil superior é .

Formulários

Função de perigo . valores de como mostrado na legenda

Análise de sobrevivência

A distribuição log-logística fornece um modelo paramétrico para análise de sobrevivência . Ao contrário da distribuição Weibull mais comumente usada , ela pode ter uma função de risco não monotônica : quando a função de risco é unimodal (quando  ≤ 1, o risco diminui monotonicamente). O fato de que a função de distribuição cumulativa pode ser escrita na forma fechada é particularmente útil para a análise de dados de sobrevivência com censura . A distribuição log-logística pode ser usada como a base de um modelo de tempo de falha acelerado , permitindo diferir entre os grupos ou, mais geralmente, introduzindo covariáveis ​​que afetam, mas não modelando como uma função linear das covariáveis.

A função de sobrevivência é

e assim a função de risco é

A distribuição log-logística com parâmetro de forma é a distribuição marginal dos inter-tempos em um processo de contagem com distribuição geométrica .

Hidrologia

Distribuição log-logística cumulativa ajustada para chuvas máximas de um dia em outubro usando CumFreq , consulte também Ajuste de distribuição

A distribuição log-logística tem sido usada em hidrologia para modelar taxas de fluxo de riachos e precipitação.

Valores extremos, como precipitação máxima em um dia e vazão do rio por mês ou por ano, geralmente seguem uma distribuição log-normal . A distribuição log-normal, no entanto, precisa de uma aproximação numérica. Como a distribuição log-logística, que pode ser resolvida analiticamente, é semelhante à distribuição log-normal, ela pode ser usada em seu lugar.

A imagem azul ilustra um exemplo de ajuste da distribuição log-logística às chuvas máximas classificadas em um dia de outubro e mostra o cinturão de confiança de 90% com base na distribuição binomial . Os dados de precipitação são representados pela posição de plotagem r / ( n +1) como parte da análise de frequência cumulativa .

Economia

A logística-logística tem sido utilizada como um modelo simples de distribuição de riqueza ou renda na economia , onde é conhecida como distribuição Fisk. Seu coeficiente de Gini é .

Derivação do coeficiente de Gini

O coeficiente de Gini para uma distribuição de probabilidade contínua assume a forma:

onde está o CDF da distribuição e é o valor esperado. Para a distribuição log-logística, a fórmula do coeficiente de Gini torna-se:

Definir a substituição leva à equação mais simples:

E fazer a substituição simplifica ainda mais a fórmula do coeficiente de Gini para:

O componente integral é equivalente à função beta padrão . A função beta também pode ser escrita como:

onde está a função gama . Usando as propriedades da função gama, pode-se mostrar que:

A partir da fórmula de reflexão de Euler , a expressão pode ser ainda mais simplificada:

Finalmente, podemos concluir que o coeficiente de Gini para a distribuição log-logística .

Networking

A logística-logística tem sido usada como um modelo para o período de tempo que começa quando alguns dados deixam um aplicativo de usuário de software em um computador e a resposta é recebida pelo mesmo aplicativo depois de viajar e ser processada por outros computadores, aplicativos e rede segmentos, a maioria ou todos eles sem garantias rígidas em tempo real (por exemplo, quando um aplicativo está exibindo dados provenientes de um sensor remoto conectado à Internet). Tem se mostrado um modelo probabilístico mais acurado para isso do que a distribuição log-normal ou outros, desde que mudanças abruptas de regime nas sequências daqueles tempos sejam apropriadamente detectadas.

Distribuições relacionadas

  • Se então
  • ( Distribuição Dagum ).
  • ( Distribuição Singh-Maddala ).
  • ( Distribuição beta principal ).
  • Se X tem uma distribuição log-logística com parâmetro de escala e parâmetro de forma, então Y  = log ( X ) tem uma distribuição logística com parâmetro de localização e parâmetro de escala
  • À medida que o parâmetro de forma da distribuição log-logística aumenta, sua forma cada vez mais se assemelha a de uma distribuição logística (muito estreita) . Informalmente:
  • A distribuição log-logística com parâmetro de forma e parâmetro de escala é a mesma que a distribuição de Pareto generalizada com parâmetro de localização , parâmetro de forma e parâmetro de escala
  • A adição de outro parâmetro (um parâmetro de deslocamento) resulta formalmente em uma distribuição log-logística deslocada , mas isso geralmente é considerado em uma parametrização diferente para que a distribuição possa ser limitada acima ou abaixo.

Generalizações

Várias distribuições diferentes são às vezes chamadas de distribuição log-logística generalizada , pois contêm a log-logística como um caso especial. Isso inclui a distribuição Burr Type XII (também conhecida como distribuição Singh – Maddala ) e a distribuição Dagum , ambas as quais incluem um segundo parâmetro de forma. Ambos são, por sua vez, casos especiais da distribuição beta generalizada ainda mais geral do segundo tipo . Outra generalização mais direta da logística-logística é a distribuição log-logística deslocada .

Outra distribuição log-logística generalizada é a transformação logarítmica da distribuição metalog , na qual as expansões das séries de potências em termos de são substituídas por parâmetros de distribuição logística e . A distribuição log-metalog resultante é altamente flexível em forma, tem formato simples e fechado de PDF e função de quantil , pode ser ajustada a dados com mínimos quadrados lineares e inclui a distribuição log-logística como um caso especial.

Veja também

Referências