Teste de alcance de Tukey - Tukey's range test

Teste de Tukey , também conhecido como teste de Tukey , método Tukey , teste de significância honesto de Tukey , ou HSD de Tukey ( diferença significativa honesta ) de teste , é um de um só passo de comparação múltipla procedimento e teste estatístico . Ele pode ser usado para localizar meios que são significativamente diferentes uns dos outros.

Nomeado após John Tukey , ele compara todos os pares possíveis de médias e é baseado em uma distribuição de intervalo estudentizada ( q ) (esta distribuição é semelhante à distribuição de t do teste t . Veja abaixo).

O teste de Tukey compara os meios de cada tratamento com os meios de todos os outros tratamentos; ou seja, aplica-se simultaneamente ao conjunto de todas as comparações de pares

e identifica qualquer diferença entre duas médias que seja maior do que o erro padrão esperado . O coeficiente de confiança para o conjunto , quando todos os tamanhos de amostra são iguais, é exatamente para qualquer um . Para tamanhos de amostra desiguais, o coeficiente de confiança é maior que 1 - α. Em outras palavras, o método de Tukey é conservador quando há tamanhos de amostra desiguais .

Premissas

  1. As observações que estão sendo testadas são independentes dentro e entre os grupos.
  2. Os grupos associados a cada média do teste são normalmente distribuídos .
  3. Há variância dentro do grupo igual entre os grupos associados a cada média no teste ( homogeneidade de variância ).

A estatística de teste

O teste de Tukey é baseado em uma fórmula muito semelhante à do teste t . Na verdade, o teste de Tukey é essencialmente um teste t , exceto que ele corrige a taxa de erro familiar .

A fórmula para o teste de Tukey é:

onde Y A é a maior das duas médias comparadas, Y B é a menor das duas médias comparadas e SE é o erro padrão da soma das médias.

Este valor q s pode então ser comparado a um valor q da distribuição de intervalo estudentizado . Se o valor de q s é maior do que o valor crítico q α obtido da distribuição, as duas médias são consideradas significativamente diferentes no nível .

Uma vez que a hipótese nula para o teste de Tukey afirma que todas as médias sendo comparadas são da mesma população (ou seja, μ 1 = μ 2 = μ 3 = ... = μ k ), as médias devem ser normalmente distribuídas (de acordo com o teorema do limite central ) Isso dá origem à suposição de normalidade do teste de Tukey.

A distribuição de intervalo estudentizado ( q )

O método de Tukey usa a distribuição de intervalo estudentizado . Suponha que tomemos uma amostra de tamanho n de cada uma das k populações com a mesma distribuição normal N ( μ , σ 2 ) e suponha que min é a menor dessas médias amostrais e max é a maior dessas médias amostrais, e suponha que S 2 é a variância da amostra combinada dessas amostras. Então, a seguinte variável aleatória tem uma distribuição de intervalo estudentizada.

Este valor de q é a base do valor crítico de q , com base em três fatores:

  1. α (a taxa de erro Tipo I , ou a probabilidade de rejeitar uma hipótese nula verdadeira)
  2. k (o número de populações)
  3. df (o número de graus de liberdade ( N  -  k ) onde N é o número total de observações)

A distribuição de q foi tabulada e aparece em muitos livros didáticos de estatística. Em algumas tabelas, a distribuição de q foi tabulada sem o fator. Para entender qual é a tabela, podemos calcular o resultado para k  = 2 e compará-lo ao resultado da distribuição t de Student com os mesmos graus de liberdade e o mesmo  α . Além disso, R oferece uma função de distribuição cumulativa ( ) e uma função de quantil ( ) para  q . ptukeyqtukey

Limites de confiança

Os limites de confiança de Tukey para todas as comparações de pares com coeficiente de confiança de pelo menos 1 - α são

Observe que o estimador de ponto e a variância estimada são iguais aos de uma única comparação de pares. A única diferença entre os limites de confiança para comparações simultâneas e aqueles para uma única comparação é o múltiplo do desvio padrão estimado.

Observe também que os tamanhos das amostras devem ser iguais ao usar a abordagem de intervalo estudentizado. é o desvio padrão de todo o design, não apenas dos dois grupos que estão sendo comparados. É possível trabalhar com tamanhos de amostra desiguais. Nesse caso, é necessário calcular o desvio padrão estimado para cada comparação entre pares, conforme formalizado por Clyde Kramer em 1956, de modo que o procedimento para tamanhos de amostra desiguais é algumas vezes referido como o método de Tukey-Kramer, que é o seguinte:

onde n i e n j são os tamanhos dos grupos i e j, respectivamente. Os graus de liberdade para todo o design também são aplicados.   

Veja também

Notas

Leitura adicional

  • Montgomery, Douglas C. (2013). Projeto e análise de experimentos (oitava ed.). Wiley. Seção 3.5.7.

links externos