Análise de covariância - Analysis of covariance

A análise de covariância ( ANCOVA ) é um modelo linear geral que combina ANOVA e regressão . ANCOVA avalia se a meio de uma variável dependente (DV) são iguais entre os diferentes níveis de um categórica variável independente (IV), muitas vezes chamado de tratamento, apesar de estatisticamente controlar os efeitos de outras variáveis contínuas que não são de interesse primário, conhecidos como covariáveis ( CV) ou variáveis ​​incômodas. Matematicamente, ANCOVA decompõe a variância no DV em variância explicada pelo (s) CV (s), variância explicada pelo IV categórico e variância residual. Intuitivamente, ANCOVA pode ser pensada como 'ajustando' o DV pelo meio de grupo do (s) CV (s).

O modelo ANCOVA assume uma relação linear entre a resposta (DV) e a covariável (CV):

Nessa equação, o DV é a jª observação sob o iº grupo categórico; o CV, é a j ésima observação da covariável sob o i ésimo grupo. As variáveis ​​no modelo que são derivadas dos dados observados são (a grande média) e (a média global para covariável ). As variáveis ​​a serem ajustadas são (o efeito do i ésimo nível do IV), (a inclinação da reta) e (o termo de erro não observado associado para a j ésima observação no i ésimo grupo).

De acordo com esta especificação, os efeitos do tratamento categórico somam zero. As premissas padrão do modelo de regressão linear também são consideradas válidas, conforme discutido abaixo.

Usos

Aumente a potência

A ANCOVA pode ser usada para aumentar o poder estatístico (a probabilidade de uma diferença significativa ser encontrada entre os grupos, quando existe), reduzindo a variância do erro dentro do grupo . A fim de entender isso, é necessário compreender o teste usado para avaliar diferenças entre os grupos, o F-teste . O teste F é calculado dividindo a variância explicada entre os grupos (por exemplo, diferenças de recuperação médica) pela variância inexplicada dentro dos grupos. Desse modo,

Se esse valor for maior que um valor crítico, concluímos que há uma diferença significativa entre os grupos. A variância inexplicada inclui a variância do erro (por exemplo, diferenças individuais), bem como a influência de outros fatores. Portanto, a influência dos CVs está agrupada no denominador. Quando controlamos o efeito dos CVs no DV, o removemos do denominador tornando F maior, aumentando assim seu poder de encontrar um efeito significativo, se houver.

Variância de particionamento

Ajustando diferenças preexistentes

Outro uso da ANCOVA é para ajustar diferenças preexistentes em grupos não equivalentes (intactos). Esta aplicação controversa visa corrigir as diferenças de grupo iniciais (antes da atribuição de grupo) que existem no DV entre vários grupos intactos. Nessa situação, os participantes não podem ser igualados por meio de atribuição aleatória, então os currículos são usados ​​para ajustar as pontuações e tornar os participantes mais semelhantes do que sem o currículo. Porém, mesmo com o uso de covariáveis, não existem técnicas estatísticas que possam equacionar grupos desiguais. Além disso, o CV pode estar tão intimamente relacionado ao IV que remover a variação do VD associado ao VC removeria uma variação considerável do VD, tornando os resultados sem sentido.

Premissas

Existem várias premissas principais que fundamentam o uso da ANCOVA e afetam a interpretação dos resultados. As suposições de regressão linear padrão são válidas ; além disso, assumimos que a inclinação da covariável é igual em todos os grupos de tratamento (homogeneidade das inclinações de regressão).

Premissa 1: linearidade da regressão

A relação de regressão entre a variável dependente e as variáveis ​​concomitantes deve ser linear.

Premissa 2: homogeneidade de variâncias de erro

O erro é uma variável aleatória com média zero condicional e variâncias iguais para diferentes classes de tratamento e observações.

Premissa 3: independência dos termos de erro

Os erros não estão correlacionados. Ou seja, a matriz de covariância do erro é diagonal.

Homogeneidade de Regression Slopes.png

Premissa 4: normalidade dos termos de erro

Os resíduos (termos de erro) devem ser normalmente distribuídos ~ .

Premissa 5: homogeneidade das inclinações de regressão

As inclinações das diferentes linhas de regressão devem ser equivalentes, ou seja, as linhas de regressão devem ser paralelas entre os grupos.

A quinta questão, relativa à homogeneidade de diferentes inclinações de regressão de tratamento, é particularmente importante na avaliação da adequação do modelo ANCOVA. Observe também que precisamos apenas que os termos de erro sejam distribuídos normalmente. Na verdade, tanto a variável independente quanto as variáveis ​​concomitantes não serão normalmente distribuídas na maioria dos casos.

Conduzindo uma ANCOVA

Teste multicolinearidade

Se um CV estiver altamente relacionado a outro CV (em uma correlação de 0,5 ou mais), então ele não ajustará o DV além do outro CV. Um ou outro deve ser removido, pois são estatisticamente redundantes.

Teste a homogeneidade da suposição de variância

Testado pelo teste de Levene de igualdade de variâncias de erro. Isso é mais importante após os ajustes terem sido feitos, mas se você o tiver antes do ajuste, é provável que o tenha depois.

Teste a homogeneidade da suposição de declives de regressão

Para ver se o CV interage significativamente com o IV, execute um modelo ANCOVA incluindo o IV e o termo de interação CVxIV. Se a interação CVxIV for significativa, ANCOVA não deve ser realizada. Em vez disso, Green & Salkind sugerem avaliar as diferenças de grupo no DV em níveis específicos do CV. Considere também o uso de uma análise de regressão moderada , tratando o CV e sua interação como outro IV. Alternativamente, pode-se usar análises de mediação para determinar se o CV leva em conta o efeito do IV no VD.

Execute a análise ANCOVA

Se a interação CV × IV não for significativa, execute novamente a ANCOVA sem o termo de interação CV × IV. Nesta análise, você precisa usar as médias ajustadas e MSerror ajustado. As médias ajustadas (também conhecidas como médias dos mínimos quadrados, médias LS, médias marginais estimadas ou EMM) referem-se às médias do grupo após controlar a influência do CV no DV.

Gráfico de efeitos principais simples mostrando uma pequena interação entre os dois níveis da variável independente.

Análises de acompanhamento

Se houve um efeito principal significativo , significa que há uma diferença significativa entre os níveis de um IV, ignorando todos os outros fatores. Para descobrir exatamente quais níveis são significativamente diferentes uns dos outros, pode-se usar os mesmos testes de acompanhamento da ANOVA. Se houver dois ou mais IVs, pode haver uma interação significativa , o que significa que o efeito de um IV no VD muda dependendo do nível de outro fator. Pode-se investigar os efeitos principais simples usando os mesmos métodos de uma ANOVA fatorial .

Considerações de poder

Enquanto a inclusão de uma covariável em uma ANOVA geralmente aumenta o poder estatístico ao contabilizar parte da variância na variável dependente e, assim, aumentar a razão da variância explicada pelas variáveis ​​independentes, adicionar uma covariável à ANOVA também reduz os graus de liberdade . Conseqüentemente, adicionar uma covariável responsável por muito pouca variação na variável dependente pode, na verdade, reduzir o poder.

Veja também

  • MANCOVA (análise multivariada de covariância)

Referências

links externos