Análise de covariância - Analysis of covariance
A análise de covariância ( ANCOVA ) é um modelo linear geral que combina ANOVA e regressão . ANCOVA avalia se a meio de uma variável dependente (DV) são iguais entre os diferentes níveis de um categórica variável independente (IV), muitas vezes chamado de tratamento, apesar de estatisticamente controlar os efeitos de outras variáveis contínuas que não são de interesse primário, conhecidos como covariáveis ( CV) ou variáveis incômodas. Matematicamente, ANCOVA decompõe a variância no DV em variância explicada pelo (s) CV (s), variância explicada pelo IV categórico e variância residual. Intuitivamente, ANCOVA pode ser pensada como 'ajustando' o DV pelo meio de grupo do (s) CV (s).
O modelo ANCOVA assume uma relação linear entre a resposta (DV) e a covariável (CV):
Nessa equação, o DV é a jª observação sob o iº grupo categórico; o CV, é a j ésima observação da covariável sob o i ésimo grupo. As variáveis no modelo que são derivadas dos dados observados são (a grande média) e (a média global para covariável ). As variáveis a serem ajustadas são (o efeito do i ésimo nível do IV), (a inclinação da reta) e (o termo de erro não observado associado para a j ésima observação no i ésimo grupo).
De acordo com esta especificação, os efeitos do tratamento categórico somam zero. As premissas padrão do modelo de regressão linear também são consideradas válidas, conforme discutido abaixo.
Usos
Aumente a potência
A ANCOVA pode ser usada para aumentar o poder estatístico (a probabilidade de uma diferença significativa ser encontrada entre os grupos, quando existe), reduzindo a variância do erro dentro do grupo . A fim de entender isso, é necessário compreender o teste usado para avaliar diferenças entre os grupos, o F-teste . O teste F é calculado dividindo a variância explicada entre os grupos (por exemplo, diferenças de recuperação médica) pela variância inexplicada dentro dos grupos. Desse modo,
Se esse valor for maior que um valor crítico, concluímos que há uma diferença significativa entre os grupos. A variância inexplicada inclui a variância do erro (por exemplo, diferenças individuais), bem como a influência de outros fatores. Portanto, a influência dos CVs está agrupada no denominador. Quando controlamos o efeito dos CVs no DV, o removemos do denominador tornando F maior, aumentando assim seu poder de encontrar um efeito significativo, se houver.
Ajustando diferenças preexistentes
Outro uso da ANCOVA é para ajustar diferenças preexistentes em grupos não equivalentes (intactos). Esta aplicação controversa visa corrigir as diferenças de grupo iniciais (antes da atribuição de grupo) que existem no DV entre vários grupos intactos. Nessa situação, os participantes não podem ser igualados por meio de atribuição aleatória, então os currículos são usados para ajustar as pontuações e tornar os participantes mais semelhantes do que sem o currículo. Porém, mesmo com o uso de covariáveis, não existem técnicas estatísticas que possam equacionar grupos desiguais. Além disso, o CV pode estar tão intimamente relacionado ao IV que remover a variação do VD associado ao VC removeria uma variação considerável do VD, tornando os resultados sem sentido.
Premissas
Existem várias premissas principais que fundamentam o uso da ANCOVA e afetam a interpretação dos resultados. As suposições de regressão linear padrão são válidas ; além disso, assumimos que a inclinação da covariável é igual em todos os grupos de tratamento (homogeneidade das inclinações de regressão).
Premissa 1: linearidade da regressão
A relação de regressão entre a variável dependente e as variáveis concomitantes deve ser linear.
Premissa 2: homogeneidade de variâncias de erro
O erro é uma variável aleatória com média zero condicional e variâncias iguais para diferentes classes de tratamento e observações.
Premissa 3: independência dos termos de erro
Os erros não estão correlacionados. Ou seja, a matriz de covariância do erro é diagonal.
Premissa 4: normalidade dos termos de erro
Os resíduos (termos de erro) devem ser normalmente distribuídos ~ .
Premissa 5: homogeneidade das inclinações de regressão
As inclinações das diferentes linhas de regressão devem ser equivalentes, ou seja, as linhas de regressão devem ser paralelas entre os grupos.
A quinta questão, relativa à homogeneidade de diferentes inclinações de regressão de tratamento, é particularmente importante na avaliação da adequação do modelo ANCOVA. Observe também que precisamos apenas que os termos de erro sejam distribuídos normalmente. Na verdade, tanto a variável independente quanto as variáveis concomitantes não serão normalmente distribuídas na maioria dos casos.
Conduzindo uma ANCOVA
Teste multicolinearidade
Se um CV estiver altamente relacionado a outro CV (em uma correlação de 0,5 ou mais), então ele não ajustará o DV além do outro CV. Um ou outro deve ser removido, pois são estatisticamente redundantes.
Teste a homogeneidade da suposição de variância
Testado pelo teste de Levene de igualdade de variâncias de erro. Isso é mais importante após os ajustes terem sido feitos, mas se você o tiver antes do ajuste, é provável que o tenha depois.
Teste a homogeneidade da suposição de declives de regressão
Para ver se o CV interage significativamente com o IV, execute um modelo ANCOVA incluindo o IV e o termo de interação CVxIV. Se a interação CVxIV for significativa, ANCOVA não deve ser realizada. Em vez disso, Green & Salkind sugerem avaliar as diferenças de grupo no DV em níveis específicos do CV. Considere também o uso de uma análise de regressão moderada , tratando o CV e sua interação como outro IV. Alternativamente, pode-se usar análises de mediação para determinar se o CV leva em conta o efeito do IV no VD.
Execute a análise ANCOVA
Se a interação CV × IV não for significativa, execute novamente a ANCOVA sem o termo de interação CV × IV. Nesta análise, você precisa usar as médias ajustadas e MSerror ajustado. As médias ajustadas (também conhecidas como médias dos mínimos quadrados, médias LS, médias marginais estimadas ou EMM) referem-se às médias do grupo após controlar a influência do CV no DV.
Análises de acompanhamento
Se houve um efeito principal significativo , significa que há uma diferença significativa entre os níveis de um IV, ignorando todos os outros fatores. Para descobrir exatamente quais níveis são significativamente diferentes uns dos outros, pode-se usar os mesmos testes de acompanhamento da ANOVA. Se houver dois ou mais IVs, pode haver uma interação significativa , o que significa que o efeito de um IV no VD muda dependendo do nível de outro fator. Pode-se investigar os efeitos principais simples usando os mesmos métodos de uma ANOVA fatorial .
Considerações de poder
Enquanto a inclusão de uma covariável em uma ANOVA geralmente aumenta o poder estatístico ao contabilizar parte da variância na variável dependente e, assim, aumentar a razão da variância explicada pelas variáveis independentes, adicionar uma covariável à ANOVA também reduz os graus de liberdade . Conseqüentemente, adicionar uma covariável responsável por muito pouca variação na variável dependente pode, na verdade, reduzir o poder.
Veja também
- MANCOVA (análise multivariada de covariância)
Referências
links externos
- Exemplos de todos os modelos ANOVA e ANCOVA com até três fatores de tratamento, incluindo bloco randomizado, gráfico dividido, medidas repetidas e quadrados latinos e sua análise em R (Universidade de Southampton)
- Análise unilateral de covariância para amostras independentes
- Uso de covariáveis em ensaios clínicos randomizados por GJP Van Breukelen e KRA Van Dijk (2007)