Desvio (estatísticas) - Deviation (statistics)
Em matemática e estatística , o desvio é uma medida da diferença entre o valor observado de uma variável e algum outro valor, geralmente a média dessa variável . O sinal do desvio informa a direção dessa diferença (o desvio é positivo quando o valor observado excede o valor de referência). A magnitude do valor indica o tamanho da diferença.
Tipos
Um desvio que é uma diferença entre um valor observado e o valor verdadeiro de uma quantidade de interesse (onde o valor verdadeiro denota o Valor Esperado, como a média da população) é um erro.
Um desvio que é a diferença entre o valor observado e uma estimativa do valor verdadeiro (por exemplo, a média da amostra; o valor esperado de uma amostra pode ser usado como uma estimativa do valor esperado da população) é um resíduo . Esses conceitos são aplicáveis para dados nos níveis de intervalo e razão de medição.
Desvio sem sinal ou absoluto
Em estatística , o desvio absoluto de um elemento de um conjunto de dados é a diferença absoluta entre esse elemento e um determinado ponto. Normalmente, o desvio é calculado a partir do valor central , sendo interpretado como algum tipo de média , na maioria das vezes a mediana ou às vezes a média do conjunto de dados:
- D i é o desvio absoluto,
- x i é o elemento de dados,
- m ( X ) é a medida escolhida de tendência central do conjunto de dados - às vezes a média ( ), mas na maioria das vezes a mediana .
Medidas
Desvio médio sinalizado
Para um estimador imparcial , a média dos desvios sinalizados em todo o conjunto de todas as observações do valor do parâmetro da população não observado é média de zero em um número arbitrariamente grande de amostras. No entanto, por construção, a média dos desvios sinalizados de valores do valor médio da amostra é sempre zero, embora o desvio sinalizado médio de outra medida de tendência central, como a mediana da amostra, não precise ser zero.
Dispersão
As estatísticas da distribuição dos desvios são utilizadas como medidas de dispersão estatística .
- O desvio padrão é a medida de dispersão frequentemente usada: ele usadesvios quadrados e tem propriedades desejáveis, mas não é robusto .
- Desvio absoluto médio , é a soma dos valores absolutos dos desvios dividido pelo número de observações.
- O desvio absoluto da mediana é uma estatística robusta que usa a mediana, não a média, dos desvios absolutos.
- O desvio absoluto máximo é uma medida altamente não robusta, que usa o desvio absoluto máximo.
Normalização
Os desvios têm unidades da escala de medição (por exemplo, metros se medir comprimentos). Pode-se não dimensionar de duas maneiras.
Uma maneira é dividir por uma medida de escala ( dispersão estatística ), na maioria das vezes o desvio padrão da população, na padronização , ou o desvio padrão da amostra, na estudentização (por exemplo, resíduo estudentizado ).
Em vez disso, pode-se escalar por localização, não por dispersão: a fórmula para um desvio percentual é o valor observado menos o valor aceito dividido pelo valor aceito multiplicado por 100%.