Média presumida - Assumed mean

Em estatística, a média assumida é um método para calcular a média aritmética e o desvio padrão de um conjunto de dados. Ele simplifica o cálculo de valores precisos manualmente. Seu interesse hoje é principalmente histórico, mas pode ser usado para estimar rapidamente essas estatísticas. Existem outros métodos de cálculo rápido que são mais adequados para computadores que também garantem resultados mais precisos do que os métodos óbvios.

Exemplo

Primeiro: a média dos seguintes números é procurada:

219, 223, 226, 228, 231, 234, 235, 236, 240, 241, 244, 247, 249, 255, 262

Suponha que comecemos com uma estimativa inicial plausível de que a média é cerca de 240. Então, os desvios dessa média "presumida" são os seguintes:

−21, −17, −14, −12, −9, −6, −5, −4, 0, 1, 4, 7, 9, 15, 22

Ao somar isso, descobre-se que:

22 e −21 quase cancelam, deixando +1,
15 e −17 quase cancelam, deixando −2,
9 e -9 cancelam,
7 + 4 cancela −6 - 5,

e assim por diante. Ficamos com uma soma de −30. A média desses 15 desvios da média assumida é, portanto, −30/15 = −2. Portanto, é isso que precisamos adicionar à média presumida para obter a média correta:

média correta = 240 - 2 = 238.

Método

O método depende da estimativa da média e do arredondamento para um valor fácil de calcular. Este valor é então subtraído de todos os valores de amostra. Quando as amostras são classificadas em intervalos de tamanhos iguais, uma classe central é escolhida e a contagem de intervalos dessa classe é usada nos cálculos. Por exemplo, para a altura das pessoas, um valor de 1,75 m pode ser usado como a média presumida.

Para um conjunto de dados com média assumida x 0, suponha:

Então

ou para um desvio padrão da amostra usando a correção de Bessel :

Exemplo de uso de intervalos de classe

Onde houver um grande número de amostras, uma estimativa rápida e razoável da média e do desvio padrão pode ser obtida agrupando as amostras em classes usando intervalos de tamanhos iguais. Isso introduz um erro de quantização, mas normalmente é preciso o suficiente para a maioria dos propósitos se 10 ou mais classes forem usadas.

Por exemplo, com exceção,

167,8 175,4 176,1 166 174,7 170,2 178,9 180,4 174,6 174,5 182,4 173,4 167,4 170,7 180,6 169,6 176,2 176,2 176,3 175,1 178,7 167,2 180,2 180,3 164,7 167,9 179,6 164,9 173,2 180,3 168 175,5 172,9 182,2 182,2 166,7 172,4 181,9 175,9 175,9 176,8 179,6 166,7 172,4 181,9 175,9 176,3 175,1 178,7 167,2 180,2 180,2 180,3 164,7 167,9 179,6 164,9 173,2 180,3 168 175,5 172,9 182,9 182,2 166,7 172,4 181,9 175,9 175,9 176,8 179,6 166,7 172,4 181,9 175,9 175,9 176,8 179,6 170,3 171,2 171,2 175,5 175,5 173,6 172,6 172,6 172,6 171,2 171,2 171,6 175,5 167,8 175,4 176,1 163,3 172,5 163,4 165,9 178,2 174,6 174,3 170,5 169,7 176,2 175,1 177 173,5 173,6 174,3 174,4 171,1 173,3 164,6 173 177,9 166,5 159,6 170,5 174,7 182 172,7 175,9 171,5 167,1 176,9 181,7 170,7 177,5 170,9 178,1 174,3 173,3 169,2 178,2 179,4 187,6 186,4 178,1 174,1 173,3 169,2 178,2 179,1 179,1 187,1 186,4 178,1 174,1 177,1 177,1175,9 171,5 159,6 178,1 174,3 173,1 177,1177 175,9 171,5 167,1 176,9 178,1 174,1 177,117,117,117,117,117,117,118,117,117,117,117,117,117,117,117.

O mínimo e o máximo são 159,6 e 187,6, podemos agrupá-los da seguinte maneira, arredondando os números para baixo. O tamanho da classe (CS) é 3. A média assumida é o centro do intervalo de 174 a 177, que é 175,5. As diferenças são contadas em classes.

Números observados em intervalos
Alcance contagem frequência classe diff freq × diff freq × diff 2
159—161 / 1 -5 -5 25
162—164 //// / 6 -4 -24 96
165—167 //// //// 10 -3 -30 90
168-170 //// //// /// 13 -2 -26 52
171-173 //// //// //// / 16 -1 -16 16
174-176 //// //// //// //// //// 25 0 0 0
177-179 //// //// //// / 16 1 16 16
180—182 //// //// / 11 2 22 44
183-185 0 3 0 0
186—188 // 2 4 8 32
Soma N = 100 A = −55 B = 371

A média é então estimada em

que está muito próximo da média real de 173,846.

O desvio padrão é estimado como

Referências