Parâmetro de escala - Scale parameter

Em teoria de probabilidade e estatística , um parâmetro de escala é um tipo especial de parâmetro numérico de uma família paramétrica de distribuições de probabilidade . Quanto maior o parâmetro de escala, mais espalhada será a distribuição.

Definição

Se uma família de distribuições de probabilidade é tal que existe um parâmetro s (e outros parâmetros θ ) para o qual a função de distribuição cumulativa satisfaz

então s é chamado de parâmetro de escala , uma vez que seu valor determina a " escala " ou dispersão estatística da distribuição de probabilidade. Se s for grande, a distribuição será mais espalhada; se s for pequeno, será mais concentrado.

Animação mostrando os efeitos de um parâmetro de escala em uma distribuição de probabilidade apoiada na linha real positiva.
Efeito de um parâmetro de escala sobre uma mistura de duas distribuições de probabilidade normal

Se a densidade de probabilidade existe para todos os valores do conjunto completo de parâmetros, então a densidade (como uma função apenas do parâmetro de escala) satisfaz

onde f é a densidade de uma versão padronizada da densidade, ou seja .

Um estimador de um parâmetro de escala é chamado de estimador de escala.

Famílias com parâmetros de localização

No caso em que uma família parametrizada tem um parâmetro de localização , uma definição ligeiramente diferente é freqüentemente usada como segue. Se denotarmos o parâmetro de localização por e o parâmetro de escala por , então exigimos que onde é o cmd para a família parametrizada. Esta modificação é necessária para que o desvio padrão de uma Gaussiana não central seja um parâmetro de escala, caso contrário, a média mudaria quando redimensionamos . No entanto, esta definição alternativa não é usada de forma consistente.

Manipulações simples

Podemos escrever em termos de , como segue:

Como f é uma função de densidade de probabilidade, ela se integra à unidade:

Pela regra de substituição do cálculo integral, temos então

Portanto, também está devidamente normalizado.

Parâmetro de taxa

Algumas famílias de distribuições usam um parâmetro de taxa (ou " parâmetro de escala inversa "), que é simplesmente o recíproco do parâmetro de escala . Por exemplo, a distribuição exponencial com parâmetro de escala β e densidade de probabilidade

poderia ser escrito de forma equivalente com o parâmetro de taxa λ como

Exemplos

  • A distribuição uniforme pode ser parametrizada com um parâmetro de localização e um parâmetro de escala .
  • A distribuição normal tem dois parâmetros: um parâmetro de localização e um parâmetro de escala . Na prática, a distribuição normal é frequentemente parametrizada em termos da escala quadrada , que corresponde à variância da distribuição.
  • A distribuição gama é geralmente parametrizada em termos de um parâmetro de escala ou seu inverso.
  • Casos especiais de distribuições onde o parâmetro de escala é igual à unidade podem ser chamados de "padrão" sob certas condições. Por exemplo, se o parâmetro de localização for igual a zero e o parâmetro de escala igual a um, a distribuição normal é conhecida como distribuição normal padrão e a distribuição de Cauchy como distribuição padrão de Cauchy.

Estimativa

Uma estatística pode ser usada para estimar um parâmetro de escala, desde que:

  • É invariante de localização,
  • Escala linearmente com o parâmetro de escala, e
  • Converge conforme o tamanho da amostra aumenta.

Várias medidas de dispersão estatística satisfazem isso. Para tornar a estatística um estimador consistente para o parâmetro de escala, deve-se, em geral, multiplicar a estatística por um fator de escala constante . Este fator de escala é definido como o valor teórico do valor obtido pela divisão do parâmetro de escala necessário pelo valor assintótico da estatística. Observe que o fator de escala depende da distribuição em questão.

Por exemplo, para usar o desvio absoluto da mediana (MAD) para estimar o desvio padrão da distribuição normal , deve-se multiplicá-lo pelo fator

onde Φ −1 é a função de quantil (inverso da função de distribuição cumulativa ) para a distribuição normal padrão. (Consulte MAD para detalhes.) Ou seja, o MAD não é um estimador consistente para o desvio padrão de uma distribuição normal, mas 1,4826 ... MAD é um estimador consistente. Da mesma forma, o desvio absoluto médio precisa ser multiplicado por aproximadamente 1,2533 para ser um estimador consistente para o desvio padrão. Diferentes fatores seriam necessários para estimar o desvio padrão se a população não seguisse uma distribuição normal.

Veja também

Referências

Leitura adicional

  • Humor, AM; Graybill, FA; Boes, DC (1974). "VII.6.2 Invariância de escala ". Introdução à teoria da estatística (3ª ed.). Nova York: McGraw-Hill.