Curtose - Kurtosis

Em teoria da probabilidade e estatística , curtose (do grego : κυρτός , kyrtos ou kurtos , que significa "curvado, arqueando") é uma medida da "tailedness" da distribuição de probabilidade de uma verdadeira -valued variável aleatória . Assim como a assimetria , a curtose descreve a forma de uma distribuição de probabilidade e há diferentes maneiras de quantificá-la para uma distribuição teórica e formas correspondentes de estimá-la a partir de uma amostra de uma população. Diferentes medidas de curtose podem ter diferentes interpretações .

A medida padrão da curtose de uma distribuição, originada em Karl Pearson , é uma versão em escala do quarto momento da distribuição. Esse número está relacionado às caudas da distribuição, não ao seu pico; portanto, a caracterização às vezes vista da curtose como "pico" está incorreta. Para esta medida, curtose mais alta corresponde a maior extremidade de desvios (ou outliers ), e não a configuração de dados perto da média .

A curtose de qualquer distribuição normal univariada é 3. É comum comparar a curtose de uma distribuição com esse valor. Distribuições com curtose menor que 3 são consideradas platicúrticas , embora isso não implique que a distribuição seja "plana", como às vezes é afirmado. Em vez disso, significa que a distribuição produz menos discrepâncias extremas do que a distribuição normal. Um exemplo de distribuição platicúrtica é a distribuição uniforme , que não produz outliers. Distribuições com curtose maior que 3 são consideradas leptocúrticas . Um exemplo de distribuição leptocúrtica é a distribuição de Laplace , que tem caudas que assintoticamente se aproximam de zero mais lentamente do que uma gaussiana e, portanto, produz mais valores discrepantes do que a distribuição normal. Também é prática comum usar uma versão ajustada da curtose de Pearson, a curtose em excesso, que é a curtose menos 3, para fornecer a comparação com a distribuição normal padrão . Alguns autores usam "curtose" por si só para se referir ao excesso de curtose. Para clareza e generalidade, no entanto, este artigo segue a convenção de não excesso e indica explicitamente onde se entende a curtose em excesso.

As medidas alternativas de curtose são: a L-curtose , que é uma versão em escala do quarto momento L ; medidas baseadas em quatro quantis de população ou amostra . Essas medidas são análogas às medidas alternativas de assimetria que não são baseadas em momentos comuns.

Momentos Pearson

A curtose é o quarto momento padronizado , definido como

onde μ 4 é o quarto momento central e σ é o desvio padrão . Várias letras são usadas na literatura para denotar a curtose. Uma escolha muito comum é κ , o que é bom, desde que esteja claro que não se refere a um cumulante . Outras opções incluem γ 2 , para ser semelhante à notação para assimetria, embora às vezes isso seja reservado para o excesso de curtose.

A curtose é delimitada abaixo pela assimetria quadrada mais 1:

onde μ 3 é o terceiro momento central . O limite inferior é realizado pela distribuição de Bernoulli . Não há limite superior para a curtose de uma distribuição de probabilidade geral e pode ser infinita.

Uma razão pela qual alguns autores favorecem o excesso de curtose é que os cumulantes são extensos . As fórmulas relacionadas à propriedade extensiva são mais naturalmente expressas em termos de excesso de curtose. Por exemplo, sejam X 1 , ..., X n variáveis ​​aleatórias independentes para as quais existe o quarto momento, e seja Y a variável aleatória definida pela soma de X i . O excesso de curtose de Y é

onde está o desvio padrão de . Em particular, se todos os X i têm a mesma variância, isso simplifica para

A razão para não subtrair 3 é que o quarto momento simples generaliza melhor para distribuições multivariadas , especialmente quando a independência não é assumida. A cocurtose entre pares de variáveis ​​é um tensor de ordem quatro . Para uma distribuição normal bivariada, o tensor de cocurtose tem termos fora da diagonal que não são nem 0 nem 3 em geral, portanto, tentar "corrigir" um excesso torna-se confuso. É verdade, entretanto, que os cumulantes conjuntos de grau maior que dois para qualquer distribuição normal multivariada são zero.

Para duas variáveis ​​aleatórias, X e Y , não necessariamente independentes, a curtose da soma, X  +  Y , é

Observe que os coeficientes binomiais aparecem na equação acima.

Interpretação

A interpretação exata da medida de curtose de Pearson (ou curtose em excesso) costumava ser contestada, mas agora está resolvida. Como observa Westfall em 2014, "... sua única interpretação inequívoca é em termos de extremidade da cauda; ou seja, ou outliers existentes (para a curtose da amostra) ou propensão para produzir outliers (para a curtose de uma distribuição de probabilidade)." A lógica é simples: curtose é a média (ou valor esperado ) dos dados padronizados elevados à quarta potência. Quaisquer valores padronizados que sejam menores que 1 (ou seja, dados dentro de um desvio padrão da média, onde o "pico" seria), contribuem com virtualmente nada para a curtose, uma vez que elevar um número menor que 1 à quarta potência o torna mais perto de zero. Os únicos valores de dados (observáveis ​​ou observáveis) que contribuem para a curtose de alguma forma significativa são aqueles fora da região do pico; ou seja, os outliers. Portanto, a curtose mede apenas outliers; não mede nada sobre o "pico".

Muitas interpretações incorretas de curtose que envolvem noções de pico foram fornecidas. Uma é que a curtose mede tanto o "pico" da distribuição quanto o peso de sua cauda . Várias outras interpretações incorretas foram sugeridas, como "falta de ombros" (onde o "ombro" é definido vagamente como a área entre o pico e a cauda, ​​ou mais especificamente como a área de cerca de um desvio padrão da média) ou " bimodalidade ". Balanda e MacGillivray afirmam que a definição padrão de curtose "é uma medida pobre da curtose, pico ou peso da cauda de uma distribuição" e, em vez disso, propõem "definir curtose vagamente como a localização e movimento livre de escala da massa de probabilidade do ombros de uma distribuição em seu centro e caudas ".

Interpretação dos mouros

Em 1986, os mouros deram uma interpretação da curtose. Deixar

onde X é uma variável aleatória, µ é a média e σ é o desvio padrão.

Agora, por definição de curtose , e pela conhecida identidade

.

A curtose agora pode ser vista como uma medida da dispersão de Z 2 em torno de sua expectativa. Alternativamente, pode ser visto como uma medida da dispersão de Z em torno de +1 e -1. κ atinge seu valor mínimo em uma distribuição simétrica de dois pontos. Em termos da variável original X , a curtose é uma medida da dispersão de X em torno dos dois valores μ  ±  σ .

Altos valores de κ surgem em duas circunstâncias:

  • onde a massa de probabilidade está concentrada em torno da média e o processo de geração de dados produz valores ocasionais longe da média,
  • onde a massa de probabilidade está concentrada nas caudas da distribuição.

Excesso de curtose

O excesso de curtose é definido como curtose menos 3. Existem 3 regimes distintos, conforme descrito abaixo.

Mesocúrtico

Distribuições com curtose de excesso zero são chamadas de mesocúrticas ou mesocurtóticas. O exemplo mais proeminente de uma distribuição mesocúrtica é a família de distribuição normal, independentemente dos valores de seus parâmetros . Algumas outras distribuições bem conhecidas podem ser mesocúrticas, dependendo dos valores dos parâmetros: por exemplo, a distribuição binomial é mesocúrtica para .

Leptocúrtico

Uma distribuição com curtose em excesso positiva é chamada de leptocúrtica ou leptocurtótica. "Lepto-" significa "esguio". Em termos de forma, uma distribuição leptocúrtica tem caudas mais grossas . Os exemplos de distribuições leptocúrtica incluem a distribuição t de Student , a distribuição de Rayleigh , de distribuição de Laplace , distribuição exponencial , a distribuição de Poisson e a distribuição logística . Essas distribuições às vezes são denominadas super-gaussianas .

Platicúrtico

O sorteio é a distribuição mais platicúrtica

Uma distribuição com curtose excessiva negativa é chamada platicúrtica ou platicurtótica. "Platy-" significa "amplo". Em termos de forma, uma distribuição platicúrtica tem caudas mais finas . Exemplos de distribuições platicúrticas incluem as distribuições uniformes contínuas e discretas e a distribuição de cosseno elevada . A distribuição mais platicúrtica de todas é a distribuição de Bernoulli com p = 1/2 (por exemplo, o número de vezes que se obtém "cara" ao lançar uma moeda uma vez, no sorteio ), para a qual o excesso de curtose é -2. Essas distribuições são às vezes chamadas de distribuição sub-Gaussiana , originalmente proposta por Jean-Pierre Kahane e posteriormente descrita por Buldygin e Kozachenko.

Exemplos gráficos

A família Pearson tipo VII

pdf para a distribuição de Pearson tipo VII com excesso de curtose do infinito (vermelho); 2 (azul); e 0 (preto)
log-pdf para distribuição de Pearson tipo VII com excesso de curtose do infinito (vermelho); 2 (azul); 1, 1/2, 1/4, 1/8 e 1/16 (cinza); e 0 (preto)

Os efeitos da curtose são ilustrados usando uma família paramétrica de distribuições cuja curtose pode ser ajustada enquanto seus momentos de ordem inferior e cumulantes permanecem constantes. Considere a família Pearson tipo VII , que é um caso especial da família Pearson tipo IV restrita a densidades simétricas. A função de densidade de probabilidade é dada por

onde a é um parâmetro de escala e m é um parâmetro de forma .

Todas as densidades nesta família são simétricas. O k- ésimo momento existe desde que m  > ( k  + 1) / 2. Para a curtose existir, precisamos de m  > 5/2. Então, a média e a assimetria existem e são idênticas a zero. Definir a 2  = 2 m  - 3 torna a variância igual à unidade. Então, o único parâmetro livre é m , que controla o quarto momento (e cumulante) e, portanto, a curtose. Pode-se reparameterizar com , onde está o excesso de curtose conforme definido acima. Isso produz uma família leptocúrtica de um parâmetro com média zero, variância unitária, assimetria zero e curtose em excesso arbitrária não negativa. A densidade reparametrizada é

No limite à medida que se obtém a densidade

que é mostrado como a curva vermelha nas imagens à direita.

Na outra direção, obtém-se a densidade normal padrão como a distribuição limite, mostrada como a curva preta.

Nas imagens à direita, a curva azul representa a densidade com excesso de curtose de 2. A imagem superior mostra que as densidades leptocúrticas nesta família têm um pico mais alto do que a densidade normal mesocúrtica, embora esta conclusão seja válida apenas para esta família selecionada de distribuições. As caudas comparativamente mais grossas das densidades leptocúrticas são ilustradas na segunda imagem, que traça o logaritmo natural das densidades de Pearson tipo VII: a curva preta é o logaritmo da densidade normal padrão, que é uma parábola . Pode-se ver que a densidade normal aloca pouca probabilidade de massa para as regiões distantes da média ("tem caudas finas"), em comparação com a curva azul da densidade leptocúrtica de Pearson tipo VII com excesso de curtose de 2. Entre a curva azul e a preto são outras densidades de Pearson tipo VII com γ 2  = 1, 1/2, 1/4, 1/8 e 1/16. A curva vermelha mostra novamente o limite superior da família Pearson tipo VII, com (o que, estritamente falando, significa que o quarto momento não existe). A curva vermelha diminui mais lentamente à medida que se move para fora da origem ("tem caudas grossas").

Outras distribuições bem conhecidas

Funções de densidade de probabilidade para distribuições selecionadas com média 0, variância 1 e diferentes curtose em excesso
Logaritmos das funções de densidade de probabilidade para distribuições selecionadas com média 0, variância 1 e curtose excessiva diferente

Várias distribuições bem conhecidas, unimodais e simétricas de diferentes famílias paramétricas são comparadas aqui. Cada um tem uma média e assimetria de zero. Os parâmetros foram escolhidos para resultar em uma variância igual a 1 em cada caso. As imagens à direita mostram curvas para as sete densidades a seguir, em escala linear e escala logarítmica :

Observe que, nesses casos, as densidades platicúrticas têm suporte limitado , enquanto as densidades com curtose em excesso positiva ou zero são suportadas em toda a linha real .

Não se pode inferir que as distribuições de curtose alta ou baixa tenham as características indicadas por esses exemplos. Existem densidades platicúrticas com suporte infinito,

e existem densidades leptocúrticas com suporte finito.

  • por exemplo, uma distribuição que é uniforme entre −3 e −0,3, entre −0,3 e 0,3 e entre 0,3 e 3, com a mesma densidade nos intervalos (−3, −0,3) e (0,3, 3), mas com 20 vezes mais densidade no intervalo (−0,3, 0,3)

Além disso, existem densidades platicúrticas com picos infinitos,

  • por exemplo, uma mistura igual da distribuição beta com parâmetros 0,5 e 1 com sua reflexão de cerca de 0,0

e existem densidades leptocúrticas que aparecem no topo plano,

  • por exemplo, uma mistura de distribuição que é uniforme entre -1 e 1 com uma distribuição t de Student T (4.0000001) , com probabilidades de mistura de 0,999 e 0,001.

Curtose de amostra

Definições

Um estimador natural, mas tendencioso

Para uma amostra de n valores, um método de estimador de momentos da curtose em excesso da população pode ser definido como

onde m 4 é o quarto momento da amostra sobre a média , m 2 é o segundo momento da amostra sobre a média (ou seja, a variância da amostra ), x i é o i ésimo valor e é a média da amostra .

Esta fórmula tem uma representação mais simples,

onde os valores são os valores de dados padronizados usando o desvio padrão definido usando n em vez de n  - 1 no denominador.

Por exemplo, suponha que os valores dos dados sejam 0, 3, 4, 1, 2, 3, 0, 2, 1, 3, 2, 0, 2, 2, 3, 2, 5, 2, 3, 999.

Então, os valores são −0,239, −0,225, −0,221, −0,234, −0,230, −0,225, −0,239, −0,230, −0,234, −0,225, −0,230, −0,239, −0,230, −0,230, −0,225, - 0,230, −0,216, −0,230, −0,225, 4,359

e os valores são 0,003, 0,003, 0,002, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,003, 0,002, 0,003, 0,003, 360,976.

A média desses valores é 18,05 e o excesso de curtose é, portanto, 18,05 - 3 = 15,05. Este exemplo deixa claro que os dados próximos ao "meio" ou "pico" da distribuição não contribuem para a estatística de curtose, portanto, a curtose não mede o "pico". É simplesmente uma medida do outlier, 999 neste exemplo.

Estimador imparcial padrão

Dado um subconjunto de amostras de uma população, o excesso de curtose da amostra acima é um estimador enviesado do excesso de curtose da população. Um estimador alternativo da curtose de excesso da população, que é imparcial em amostras aleatórias de uma distribuição normal, é definido como segue:

onde k 4 é o estimador não enviesado simétrico único do quarto cumulante , k 2 é a estimativa não enviesada do segundo cumulante (idêntico à estimativa não enviesada da variância da amostra), m 4 é o quarto momento da amostra sobre a média, m 2 é o segundo momento amostral sobre a média, x i é o i ésimo valor e é a média amostral. Este coeficiente de momento padronizado de Fisher-Pearson ajustado é a versão encontrada no Excel e em vários pacotes estatísticos, incluindo Minitab , SAS e SPSS .

Infelizmente, em amostras não normais é geralmente tendencioso.

Limite superior

Um limite superior para a curtose de amostra de n ( n > 2) números reais é

onde é a assimetria de amostra correspondente.

Variância sob normalidade

A variação da curtose da amostra de uma amostra de tamanho n da distribuição normal é

Dito de outra forma, supondo que a variável aleatória subjacente é normalmente distribuída, pode-se demonstrar isso .

Formulários

A curtose de amostra é uma medida útil para saber se há um problema com valores discrepantes em um conjunto de dados. Uma curtose maior indica um problema de outlier mais sério e pode levar o pesquisador a escolher métodos estatísticos alternativos.

O teste K-quadrado de D'Agostino é um teste de normalidade de ajuste perfeito baseado em uma combinação de assimetria e curtose da amostra, assim como o teste de Jarque-Bera para normalidade.

Para amostras não normais, a variância da variância da amostra depende da curtose; para obter detalhes, consulte a variação .

A definição de curtose de Pearson é usada como um indicador de intermitência na turbulência . Também é usado em imagens de ressonância magnética para quantificar a difusão não gaussiana.

Um exemplo concreto é o seguinte lema de He, Zhang e Zhang: Suponha que uma variável aleatória tem expectativa , variância e curtose . Suponha que tiramos amostras de muitas cópias independentes. Então

.

Isso mostra que, com muitas amostras, veremos uma que está acima da expectativa com probabilidade, pelo menos . Em outras palavras: se a curtose for grande, podemos ver muitos valores abaixo ou acima da média.

Convergência de curtose

Aplicando filtros passa-banda a imagens digitais , os valores de curtose tendem a ser uniformes, independente da faixa do filtro. Esse comportamento, denominado convergência de curtose , pode ser usado para detectar o splicing de imagens em análises forenses .

Outras medidas

Uma medida diferente de "curtose" é fornecida pelo uso de momentos L em vez dos momentos ordinários.

Veja também

Referências

Leitura adicional

links externos