teste de Dunnett - Dunnett's test

Em estatísticas , teste de Dunnett é uma comparação múltipla procedimento desenvolvido pelo estatístico canadense Charles Dunnett para comparar cada um de uma série de tratamentos com um único controle. As comparações múltiplas para um controle são também referidos comparações como muitos-para-um.

História

teste de Dunnett foi desenvolvido em 1955; um quadro actualizado de valores críticos foi publicado em 1964.

Comparações Múltiplas Problem

A comparações múltiplas, ou multiplicidade problema testes múltiplos ocorre quando se considera um conjunto de inferências estatísticas, simultaneamente ou infere um subconjunto de parâmetros seleccionados com base nos valores observados. A questão importante em qualquer discussão de procedimentos de comparações múltiplas é a questão da probabilidade de erros do tipo I. A maioria das diferenças entre as técnicas alternativas resultar de diferentes abordagens para a questão de como controlar esses erros. O problema é na parte técnica; mas é realmente muito mais uma questão subjetiva de como você deseja definir a taxa de erro e como grande você está disposto a deixar a taxa de erro máxima possível ser. Teste de Dunnett são bem conhecidos e amplamente utilizados no procedimento de comparação múltipla para comparar simultaneamente, por estimativa ou intervalo de testes de hipóteses, todos os tratamentos activos com um controlo, quando a amostragem a partir de uma distribuição em que o pressuposto de normalidade é razoável. O teste de Dunnett foi concebido para manter a taxa de erro familywise igual ou inferior ao realizar comparações múltiplas de grupo de tratamento com o controlo.

Usos do teste de Dunnett

O trabalho original sobre Multiple problema Comparações foi feita por Tukey e Scheffé . Seu método era um geral, que considerou todos os tipos de comparações de pares. Métodos de Scheffe de Tukey e permitir que qualquer número de comparações entre um conjunto de meios de amostra. Por outro lado, o teste de Dunnett só compara um grupo com os outros, abordando um caso especial de comparações múltiplas problema - comparações de pares de vários grupos de tratamento com um único grupo de controle. No caso geral, em que se compara cada um dos pares, nós fazer comparações (onde k é o número de grupos), mas também no tratamento vs controla caso, vamos fazer apenas comparações. Se no caso de grupos de tratamento e controle estávamos a usar os métodos mais gerais de Tukey e Scheffé das, eles podem resultar em intervalos de confiança desnecessariamente largura. Teste de Dunnett leva em consideração a estrutura especial de comparando o tratamento contra o controlo, obtendo-se em intervalos de confian mais estreitos. É muito comum utilizar o teste de Dunnett em experiências médicas, por exemplo comparando as medições de contagem de sangue em três grupos de animais, um dos quais serviu como um controlo enquanto as outras duas foram tratadas com duas drogas diferentes. Outro uso comum deste método é entre agrônomos: agrônomos pode querer estudar o efeito de determinados produtos químicos adicionados ao solo no rendimento da cultura, então eles vão deixar algumas parcelas não tratada (parcelas de controle) e compará-los com as parcelas onde os produtos químicos foram adicionados ao o solo (parcelas de tratamento).

descrição formal do teste de Dunnett

O teste de Dunnett é realizada através do cálculo de uma estatística t de Student para cada experimental, ou de tratamento, em que o grupo estatística compara o grupo de tratamento com um único grupo de controlo. Uma vez que cada comparação tem o mesmo controle em comum, o processo incorpora as dependências entre estas comparações. Em particular, as estatísticas t são todos derivados da mesma estimativa da variância de erro que é obtido através da junção das somas dos quadrados para o erro em todos os grupos de tratamento () e de controlo. A estatística de teste formal para teste de Dunnett ou é o maior em valor absoluto dessas estatísticas t (se for necessário um teste de duas caudas), ou o mais negativo ou mais positivo das estatísticas t (se um teste de uma cauda é requeridos).

No teste de Dunnett podemos usar uma tabela comum de valores críticos, mas opções mais flexíveis são hoje facilmente disponíveis em muitos pacotes de estatísticas, tais como R . Os valores críticos para qualquer dado ponto percentual dependem de: se um teste bicaudal um- ou- é realizada; o número de grupos a ser comparados; o número total de ensaios.

Suposições

A análise considera o caso em que os resultados da experiência são numéricas, e a experiência é realizada para comparar tratamentos de p com um grupo de controlo. Os resultados podem ser resumidos como um conjunto de meios calculados dos conjuntos de observações, , enquanto está a referir-se ao tratamento e refere-se ao conjunto de observações de controlo, e é uma estimativa independente do desvio padrão comum de todos os conjuntos de observações. Todos os conjuntos de observações são assumidos para ser independentemente e normalmente distribuídos com uma comum variância e meio . Há também uma suposição de que há uma estimativa disponível para .

Cálculo

Cálculo do teste de Dunnett é um processo que se baseia no cálculo demonstrações de confiança sobre a verdadeira ou os valores esperados das diferenças , assim, as diferenças entre os grupos de tratamento significativo e média do grupo de controlo. Este procedimento garante que a probabilidade de todas as declarações sendo simultaneamente correcta é igual a um valor especificado, . Ao calcular uma parte superior (ou inferior) face Intervalo de confiança para o verdadeiro valor da diferença entre a média do tratamento e o grupo de controlo , constitui a probabilidade de que este valor real será menor do que a parte superior (ou maior do que o inferior) limite desse intervalo. Ao calcular frente e verso intervalo de confiança , constitui a probabilidade de que o verdadeiro valor será entre o superior e os limites inferiores.

Em primeiro lugar, vamos designar os N observações disponíveis por quando e e estimar o comum variância , por exemplo: quando é a média de grupo e é o número de observações em grupo , e graus de liberdade. Como mencionado antes, gostaríamos de obter os limites de confiança separado para cada uma das diferenças de tal modo que a probabilidade de que todos os intervalos de confiança irá conter o correspondente é igual a .

Vamos considerar o caso geral onde existem grupos de tratamento e um grupo controle. Vamos escrever:

vamos também escrever: , que segue a estatística t de Student distribuição com n graus de liberdade . Os limites de confiança inferiores com coeficiente de confiança conjunta para os efeitos do tratamento será dado por:

e as constantes são escolhidos de modo a que . Do mesmo modo, os limites superiores será dada por:

Para delimitadora em ambas as direções, o seguinte intervalo pode ser tomada:

quando são escolhidos para satisfazer . A solução para estes valores particulares de por dois lados e teste para um teste de dois lados é apresentada nos quadros. Uma tabela atualizada dos valores críticos foi publicado em 1964.

Exemplos

Resistência à ruptura de tecido

O exemplo que se segue foi adaptado a partir de uma dada pela Villars [6]. Os dados representam as medições sobre a resistência à ruptura do tecido tratado por três processo químico diferente, em comparação com um método padrão de fabrico.

resistência à ruptura (lbs.)
padrão processo 1 processo de dois processo três
55 55 55 50
47 64 49 44
48 64 52 41
Significa 50 61 52 45
variação 19 27 9 21

Aqui, p = 3 e N = 3. A variação média é , o que é uma estimativa da variância comum dos quatro conjuntos com (p + 1) (n-1) = 8 graus de liberdade. Isto pode ser calculado da seguinte forma:

.

O desvio padrão é e o erro padrão estimado de uma diferença entre os dois meios é .

A quantidade que deve ser adicionada a e / ou subtraídas das diferenças observadas entre os meios para dar os seus limites de confiança foi chamado de Tukey um "subsídio" e é dado por , onde T é obtido a partir da Tabela de Dunnett 1 se um limites laterais são ou desejado a partir da Tabela 2 de Dunnett se os limites de dois lados são desejados. Para p = 3 e df = 8, t = 2,42 para um limites laterais e t = 2.88 para obter os limites de dois lados para p = 95%. Valores análogos de t pode ser determinado a partir das tabelas de se p = 99% de confiança é necessária. Para limites de uma só face, a provisão é A = (2,42) (3,56) = 9 e o experimentador pode-se concluir que:

  • A resistência à ruptura utilizando um processo supera o padrão por pelo menos
  • A resistência à ruptura usando o processo de dois excede o padrão de, pelo menos .
  • A resistência à ruptura utilizando o processo 3 excede o padrão de, pelo menos .

A declaração conjunta que consiste nos três acima conclusões tem um coeficiente de confiança de 95%, ou seja, no longo prazo, 95% de tais declarações conjuntas serão realmente correta. Os limites superiores para os três diferenças podem ser obtidos de uma maneira análoga. Para limites de dois lados, a provisão é A = (2,94) (3,56) = 11, e o experimentador pode-se concluir que:

  • A resistência à ruptura utilizando um processo supera o padrão por uma quantidade entre

e

  • A resistência à ruptura usando o processo de dois supera o padrão por uma quantidade entre

e .

  • A resistência à ruptura utilizando o processo 3 excede o padrão de um valor entre

e . O coeficiente de confiança conjunta para estes três afirmação é superior a 95%. (Devido a uma aproximação feita na computação Tabelas 2a e 2b, os valores tabelados de t são um pouco maiores do que o necessário de modo que o do p real atingida são ligeiramente maior do que 95 e 99% .Nenhuma tal aproximação foi feita em computação Tabelas 1a e 1b) .

Referências

  1. ^ Upton G. & Cook I. (2006) A Dictionary of Statistics , 2e, Oxford University Press, Oxford, Reino Unido.
  2. ^ Rumsey, Deborah (2009-08-19). Estatísticas II for Dummies . Retirado 2012/08/22 .
  3. ^ Everett BS & Shrondal A. (2010) The Cambridge Dictionary of Statistics , 4e, Cambridge University Press, Cambridge, Reino Unido.
  4. ^ "Statistical Software | Universidade de Tecnologia da Informação Kentucky" . Uky.edu . Retirado 2012/08/22 .
  5. ^ Uma b c d Dunnett CW (1955) "Um procedimento de comparação múltipla para a comparação de vários tratamentos com um controlo", Journal of the American Statistical Association , 50 : 1096-1121.
  6. ^ Um b Dunnett CW (1964) "Novas tabelas de comparações múltiplas com um controle", Biometrics , 20 : 482-491.
  7. ^ Um b c David C. Howell, "Métodos estatísticos para Psychology", 8ª ed.
  8. ^ Teste de Dunnett , HyperStat on-line: Um introdutórias Estatísticas Textbook e Tutorial online para Ajuda em Estatística Cursos
  9. ^ Mecânica de diferentes testes - Bioestatística BI 345 , Santo Anselmo Colégio