análise componente ANOVA-simultânea - ANOVA–simultaneous component analysis

Análise de variância - análise simultânea componente ( ASCA ou ANOVA-SCA ) é um método que decompõe variação e permite a interpretação destes partições por SCA, um método que é semelhante à análise de componentes principais (PCA) . Este método é um multivariada extensão ou mesmo megavariate de análise de variância (ANOVA) . O particionamento de variação é semelhante à análise de variância. Cada partição corresponde toda a variação induzida por um efeito ou factor de , geralmente um regime de tratamento ou condição experimental. As partições do efeito calculado são chamados estimativas de efeito. Porque mesmo as estimativas de efeito são multivariada, a interpretação dessas estimativas de efeitos não é intuitivo. Através da aplicação de SCA no efeito estima que se obtém um resultado interpretável simples. Em caso de mais de um efeito este método calcula os efeitos de tal forma que os diferentes efeitos não são correlacionados.

detalhes

Muitas áreas de pesquisa ver cada vez mais um grande número de variáveis em apenas algumas amostras . A partir da amostra de rácio variável cria problemas conhecidos como multicollinearity e singularidade . Devido a isso, a maioria dos métodos estatísticos multivariados tradicionais não pode ser aplicada.

algoritmo ASCA

Esta seção detalha como calcular o modelo ASCA em um caso de dois efeitos principais com efeito uma interação. É fácil estender o raciocínio declarado mais efeitos principais e mais efeitos de interação. Se o primeiro efeito é o tempo e o segundo efeito é a dosagem, somente a interacção entre o tempo e dosagem existe. Nós assumimos há quatro pontos de tempo e três níveis de dosagem.

Seja X uma matriz que contém os dados. X é dizer centrado, tendo assim de zero colunas médios . Sejam A e B designam os efeitos principais e a interacção AB destes efeitos. Dois efeitos principais em uma experiência biológica pode ser de tempo (A) e pH (B), e estes dois efeitos podem interagir. Na concepção de tais experiências uma controla os principais efeitos de vários (pelo menos dois) níveis. Os diferentes níveis de um efeito pode ser referido como A1, A2, A3 e A4, que representa 2, 3, 4, 5 horas a partir do início da experiência. A mesma coisa vale para efeito B, por exemplo, pH 6, pH 7 e pH 8 podem ser considerados níveis de efeito.

A e B são obrigados a ser equilibrado se as estimativas de efeito precisam ser ortogonal e o particionamento único. Matrix E mantém a informação que não é atribuído a nenhum efeito. O particionamento dá a seguinte notação:

Calculando efeito principal estimativa A (ou B)

Encontre todas as linhas que correspondem ao efeito que um nível 1 e médias essas linhas. O resultado é um vector . Repita este procedimento para os outros níveis de efeito. Faça uma nova matriz do mesmo tamanho de X e coloque as médias calculadas nas linhas correspondentes. Isto é, dar todas as linhas que correspondem efeito (isto é) Um nível de 1 a média do efeito Um nível 1. Depois de concluir as estimativas de nível para o efeito, realizar uma SCA. As pontuações do SCA são os desvios de amostra para o efeito, as variáveis importantes deste efeito são nos pesos do vector SCA carregamento.

Calculando efeito de interacção estimativa AB

Estimando o efeito de interacção é semelhante ao estimar os efeitos principais. A diferença é que para a interacção estima as linhas que correspondem efeito Um nível 1 são combinados com o nível de efeito B 1 e todas as combinações de efeitos e níveis são reciclados através de. Na nossa configuração, com quatro pontos de tempo e três níveis de dosagem de exemplo, existem 12 conjuntos de interacção {A1-B1, A1B2, A2B1, A2B2 e assim por diante}. É importante para esvaziar (remover) os principais efeitos antes de estimar o efeito de interacção.

SCA em partições A, B e AB

análise simultânea componente é matematicamente idênticas para APC, mas é semanticamente diferente na medida em que os modelos diferentes objetos ou sujeitos ao mesmo tempo. A notação padrão para a SCA - e PCA - modelo é:

onde X é os dados, T são as pontuações de componentes e P são as cargas dos componentes. E é o residual ou erro matriz. Porque os modelos de ASCA as partições de variação por SCA, o modelo para estimativas de efeito parecido com este:

Note-se que cada partição tem a sua própria matriz de erro. No entanto, álgebra dita que de uma forma equilibrada as médias dos dados centrado definidos cada sistema de dois níveis é de classificação 1. Isto resulta em erros de zero, uma vez que qualquer matriz de posto 1 pode ser escrita como o produto de um único componente de pontuação e carregamento do vetor.

O modelo ASCA completa com dois efeitos e interação, incluindo a SCA se parece com isso:

Decomposição:

Tempo como um efeito

Uma vez que o 'tempo' é tratado como um factor qualitativa na ASCA ANOVA decomposição anterior, uma trajectória tempo multivariada não-linear pode ser modelado. Um exemplo disto é mostrado na Figura 10 desta referência.

Referências