Média - Average

Na linguagem coloquial , uma média é um único número considerado representativo de uma lista não vazia de números. Diferentes conceitos de média são usados ​​em diferentes contextos. Freqüentemente, "média" se refere à média aritmética , a soma dos números dividida por quantos números estão sendo calculados. Em estatística , média , mediana e modo são todos conhecidos como medidas de tendência central e, no uso coloquial, qualquer uma delas pode ser chamada de valor médio .

Propriedades gerais

Se todos os números em uma lista forem iguais, sua média também será igual a esse número. Esta propriedade é compartilhada por cada um dos muitos tipos de média.

Outra propriedade universal é a monotonicidade : se duas listas de números A e B têm o mesmo comprimento, e cada entrada da lista A é pelo menos tão grande quanto a entrada correspondente na lista B , então a média da lista A é pelo menos igual à de lista B . Além disso, todas as médias satisfazem a homogeneidade linear : se todos os números de uma lista são multiplicados pelo mesmo número positivo, então sua média muda pelo mesmo fator.

Em alguns tipos de média, os itens da lista recebem pesos diferentes antes de a média ser determinada. Isso inclui a média aritmética ponderada , a média geométrica ponderada e a mediana ponderada . Além disso, para alguns tipos de média móvel , o peso de um item depende de sua posição na lista. A maioria dos tipos de média, entretanto, satisfaz a insensibilidade à permutação : todos os itens contam igualmente na determinação de seu valor médio e suas posições na lista são irrelevantes; a média de (1, 2, 3, 4, 6) é a mesma de (3, 2, 6, 4, 1).

Pitagóricas significa

A média aritmética , a média geométrica e a média harmônica são conhecidas coletivamente como as médias pitagóricas .

Localização estatística

A moda , a mediana e o intervalo médio são frequentemente usados ​​além da média como estimativas de tendência central em estatísticas descritivas . Tudo isso pode ser visto como uma forma de minimizar a variação em alguma medida; veja tendência central § Soluções para problemas variacionais .

Comparação de médias comuns de valores {1, 2, 2, 3, 4, 7, 9}
Modelo Descrição Exemplo Resultado
Média aritmética Soma dos valores de um conjunto de dados dividido pelo número de valores: (1 + 2 + 2 + 3 + 4 + 7 + 9) / 7 4
Mediana Valor médio separando as metades maior e menor de um conjunto de dados 1, 2, 2, 3 , 4, 7, 9 3
Modo Valor mais frequente em um conjunto de dados 1, 2 , 2 , 3, 4, 7, 9 2
Intervalo médio A média aritmética dos valores mais altos e mais baixos de um conjunto (1 + 9) / 2 5

Modo

Comparação da média aritmética , mediana e modo de duas distribuições log-normais com diferentes assimetrias

O número que ocorre com mais frequência em uma lista é chamado de modo. Por exemplo, o modo da lista (1, 2, 2, 3, 3, 3, 4) é 3. Pode acontecer que dois ou mais números ocorram com a mesma frequência e com mais frequência do que qualquer outro número. Neste caso, não existe uma definição acordada de modo. Alguns autores dizem que são todos modos e alguns dizem que não há modo.

Mediana

A mediana é o número do meio do grupo quando eles são classificados em ordem. (Se houver um número par de números, a média dos dois do meio é considerada.)

Assim, para encontrar a mediana, ordene a lista de acordo com a magnitude de seus elementos e, em seguida, remova repetidamente o par que consiste nos valores mais alto e mais baixo até que um ou dois valores restem. Se sobrar exatamente um valor, é a mediana; se dois valores, a mediana é a média aritmética desses dois. Este método pega a lista 1, 7, 3, 13 e ordena que ela leia 1, 3, 7, 13. Em seguida, 1 e 13 são removidos para obter a lista 3, 7. Como existem dois elementos nesta lista restante, a mediana é sua média aritmética, (3 + 7) / 2 = 5.

Intervalo médio

O intervalo médio é a média aritmética dos valores mais alto e mais baixo de um conjunto.

Resumo dos tipos

Nome Equação ou descrição
Média aritmética
Mediana O valor médio que separa a metade superior da metade inferior do conjunto de dados
Mediana geométrica Uma extensão invariante de rotação da mediana para pontos em R n
Modo O valor mais frequente no conjunto de dados
Média geométrica
Média harmônica
Média quadrática
(ou RMS)
Média cúbica
Média generalizada
Média ponderada
Média truncada A média aritmética dos valores dos dados após um certo número ou proporção dos valores de dados mais altos e mais baixos terem sido descartados
Média interquartil Um caso especial da média truncada, usando o intervalo interquartil . Um caso especial da média truncada interquantil, que opera em quantis (frequentemente decis ou percentis) que são equidistantes, mas em lados opostos da mediana.
Intervalo médio
Winsorized significa Semelhante à média truncada, mas, em vez de excluir os valores extremos, eles são definidos como os maiores e menores valores que permanecem

A tabela de símbolos matemáticos explica os símbolos usados ​​abaixo.

Tipos diversos

Outras médias mais sofisticadas são: média trimeana , trimediana e normalizada , com suas generalizações.

Pode-se criar sua própria métrica média usando o f- médio generalizado :

onde f é qualquer função invertível. A média harmônica é um exemplo disso usando f ( x ) = 1 / x , e a média geométrica é outro, usando f ( x ) = log  x .

No entanto, este método para gerar meios não é geral o suficiente para capturar todas as médias. Um método mais geral para definir uma média assume qualquer função g ( x 1x 2 , ...,  x n ) de uma lista de argumentos que é contínua , aumentando estritamente em cada argumento, e simétrica (invariante sob a permutação dos argumentos ) O y médio é então o valor que, ao substituir cada membro da lista, resulta no mesmo valor da função: g ( y , y , ..., y ) = g ( x 1 , x 2 , ..., x n ) . Essa definição mais geral ainda captura a propriedade importante de todas as médias de que a média de uma lista de elementos idênticos é o próprio elemento. A função g ( x 1 , x 2 , ..., x n ) = x 1 + x 2 + ··· + x n fornece a média aritmética. A função g ( x 1 , x 2 , ..., x n ) = x 1 x 2 ··· x n (onde os elementos da lista são números positivos) fornece a média geométrica. A função g ( x 1 , x 2 , ..., x n ) = - ( x 1 −1 + x 2 −1 + ··· + x n −1 ) (onde os elementos da lista são números positivos) fornece o média harmônica.

Retorno percentual médio e CAGR

Um tipo de média usada em finanças é o retorno percentual médio. É um exemplo de média geométrica. Quando os retornos são anuais, é chamada de Taxa de crescimento anual composta (CAGR). Por exemplo, se estivermos considerando um período de dois anos, e o retorno do investimento no primeiro ano for −10% e o retorno no segundo ano for + 60%, então o retorno percentual médio ou CAGR, R , pode ser obtido resolvendo a equação: (1 - 10%) × (1 + 60%) = (1 - 0,1) × (1 + 0,6) = (1 + R ) × (1 + R ) . O valor de R que torna esta equação verdadeira é 0,2, ou 20%. Isso significa que o retorno total no período de 2 anos é o mesmo como se houvesse um crescimento de 20% a cada ano. A ordem dos anos não faz diferença - o retorno percentual médio de + 60% e -10% é o mesmo resultado de -10% e + 60%.

Este método pode ser generalizado para exemplos em que os períodos não são iguais. Por exemplo, considere um período de meio ano para o qual o retorno é de −23% e um período de dois anos e meio para o qual o retorno é de + 13%. O retorno percentual médio para o período combinado é o retorno de um único ano, R , que é a solução da seguinte equação: (1 - 0,23) 0,5 × (1 + 0,13) 2,5 = (1 + R ) 0,5 + 2,5 , dando um retorno médio R de 0,0600 ou 6,00%.

Média móvel

Dada uma série temporal , como preços diários do mercado de ações ou temperaturas anuais, as pessoas geralmente desejam criar uma série mais uniforme. Isso ajuda a mostrar tendências subjacentes ou talvez comportamento periódico. Uma maneira fácil de fazer isso é a média móvel : escolhe-se um número n e cria-se uma nova série tomando a média aritmética dos primeiros n valores e, em seguida, avançando uma posição, descartando o valor mais antigo e introduzindo um novo valor no outro fim da lista e assim por diante. Esta é a forma mais simples de média móvel. As formas mais complicadas envolvem o uso de uma média ponderada . A ponderação pode ser usada para melhorar ou suprimir vários comportamentos periódicos e há uma análise muito extensa de quais ponderações usar na literatura sobre filtragem . No processamento de sinal digital, o termo "média móvel" é usado mesmo quando a soma dos pesos não é 1,0 (então a série de saída é uma versão em escala das médias). A razão para isso é que o analista geralmente está interessado apenas na tendência ou no comportamento periódico.

História

Origem

A primeira vez registrada em que a média aritmética foi estendida de 2 para n casos para o uso da estimativa foi no século XVI. Do final do século dezesseis em diante, gradualmente tornou-se um método comum para reduzir erros de medição em várias áreas. Na época, os astrônomos queriam saber um valor real de medições barulhentas, como a posição de um planeta ou o diâmetro da lua. Usando a média de vários valores medidos, os cientistas presumiram que os erros somam um número relativamente pequeno quando comparado ao total de todos os valores medidos. O método de calcular a média para reduzir os erros de observação foi, de fato, desenvolvido principalmente na astronomia. Um possível precursor da média aritmética é o intervalo médio (a média dos dois valores extremos), usado por exemplo na astronomia árabe dos séculos IX ao XI, mas também na metalurgia e na navegação.

No entanto, existem várias referências vagas mais antigas ao uso da média aritmética (que não são tão claras, mas podem razoavelmente ter a ver com nossa definição moderna da média). Em um texto do século 4, estava escrito que (o texto entre colchetes é um possível texto ausente que pode esclarecer o significado):

Em primeiro lugar, devemos definir em uma linha a sequência de números da mônada até nove: 1, 2, 3, 4, 5, 6, 7, 8, 9. Então devemos somar a quantidade de todos deles juntos, e como a linha contém nove termos, devemos procurar a nona parte do total para ver se ela já está naturalmente presente entre os números da linha; e descobriremos que a propriedade de ser [um] nono [da soma] pertence apenas ao próprio meio [aritmético] ...

Existem referências potenciais ainda mais antigas. Há registros de que, por volta de 700 aC, mercadores e embarcadores concordaram que os danos à carga e ao navio (sua "contribuição" em caso de danos marítimos) deveriam ser divididos igualmente entre eles. Isso pode ter sido calculado usando a média, embora pareça não haver nenhum registro direto do cálculo.

Etimologia

A raiz é encontrada em árabe como عوار ʿawār , um defeito ou qualquer coisa com defeito ou danificado, incluindo mercadoria parcialmente estragada; e عواري ʿawārī (também عوارة ʿawāra ) = "de ou relacionado a ʿawār , um estado de dano parcial". Nas línguas ocidentais, a história da palavra começa no comércio marítimo medieval no Mediterrâneo. Avaria latina de Gênova dos séculos 12 e 13 significava "danos, perdas e despesas não normais decorrentes de uma viagem marítima mercante"; e o mesmo significado para avaria está em Marselha em 1210, Barcelona em 1258 e Florença no final do século 13. Avarie francesa do século 15 tinha o mesmo significado e gerou o inglês "averay" (1491) e o inglês "average" (1502) com o mesmo significado. Hoje, Italiano avaria , Catalão avaria e Francês avarie ainda tem o significado primário de "dano". A enorme transformação do significado em inglês começou com a prática nos contratos de lei da marinha mercante ocidental da Idade Média tardia e do início da modernidade, segundo os quais, se o navio enfrentasse uma forte tempestade e algumas das mercadorias tivessem de ser jogadas ao mar para torná-lo mais leve e seguro , então, todos os mercadores cujas mercadorias estavam no navio deveriam sofrer proporcionalmente (e não aqueles que fossem as mercadorias lançadas ao mar); e, de maneira mais geral, deveria haver distribuição proporcional de qualquer avaria . A partir daí, a palavra foi adotada por seguradoras, credores e comerciantes britânicos para falar sobre suas perdas como sendo espalhadas por todo o portfólio de ativos e tendo uma proporção média. O significado de hoje se desenvolveu a partir disso e começou em meados do século 18, e começou em inglês. [1] .

Os danos marítimos são uma média particular , que é suportada apenas pelo proprietário da propriedade danificada, ou média geral , em que o proprietário pode reivindicar uma contribuição proporcional de todas as partes do empreendimento marítimo. O tipo de cálculo usado no ajuste da média geral deu lugar ao uso de "média" para significar "média aritmética".

Um segundo uso inglês, documentado já em 1674 e às vezes soletrado "averish", é como resíduo e segundo crescimento de safras agrícolas, que foram consideradas adequadas ao consumo por animais de tração ("avers").

Há um uso anterior (pelo menos desde o século 11) não relacionado da palavra. Parece ser um termo legal antigo para a obrigação de um dia de trabalho do inquilino para com um xerife, provavelmente anglicizado de "avera", encontrado no Domesday Book inglês (1085).

O Oxford English Dictionary, no entanto, diz que as derivações do alemão hafen haven e do árabe ʿawâr loss, damage, foram "completamente eliminadas" e a palavra tem origem românica.

As médias como ferramenta retórica

Devido à natureza coloquial acima mencionada do termo "média", o termo pode ser usado para ofuscar o verdadeiro significado dos dados e sugerir respostas variadas às perguntas com base no método de cálculo da média (mais frequentemente média aritmética, mediana ou modo) usado. Em seu artigo "Framed for Lying: Statistics as In / Artistic Proof", o membro do corpo docente da Universidade de Pittsburgh, Daniel Libertz, comenta que as informações estatísticas são freqüentemente descartadas dos argumentos retóricos por esse motivo. No entanto, devido ao seu poder de persuasão, as médias e outros valores estatísticos não devem ser completamente descartados, mas sim usados ​​e interpretados com cautela. Libertz nos convida a nos engajarmos criticamente não apenas com informações estatísticas, como médias, mas também com a linguagem usada para descrever os dados e seus usos, dizendo: "Se as estatísticas dependem da interpretação, os retores deveriam convidar seu público a interpretar ao invés de insistir em um interpretação." Em muitos casos, dados e cálculos específicos são fornecidos para ajudar a facilitar essa interpretação com base no público.

Veja também

Referências

links externos