Teoria Hebbian - Hebbian theory

A teoria Hebbian é uma teoria neurocientífica que afirma que um aumento na eficácia sináptica surge da estimulação repetida e persistente de uma célula pós-sináptica por uma célula pré- sináptica. É uma tentativa de explicar a plasticidade sináptica , a adaptação dos neurônios cerebrais durante o processo de aprendizagem. Foi introduzido por Donald Hebb em seu livro de 1949, The Organization of Behavior . A teoria também é chamado de regra de Hebb , postulado de Hebb , e teoria de montagem de células . Hebb afirma o seguinte:

Vamos supor que a persistência ou repetição de uma atividade reverberatória (ou "traço") tende a induzir mudanças celulares duradouras que aumentam sua estabilidade. ... Quando um axônio da célula A está perto o suficiente para excitar uma célula B e repetidamente ou persistentemente participa disparando-lo, algum processo de crescimento ou alteração metabólica ocorre em uma ou ambas as células de modo que A eficiência 's, como um dos as células que disparam B aumentam.

A teoria costuma ser resumida como "Células que disparam juntas se conectam". No entanto, Hebb enfatizou que a célula A necessidade de "tomar parte em disparar" célula B , e tal causalidade só pode ocorrer se a célula A incêndios pouco antes, não ao mesmo tempo que, de células B . Este aspecto da causalidade no trabalho de Hebb prenunciou o que agora se sabe sobre a plasticidade dependente do tempo de pico , que requer precedência temporal.

A teoria tenta explicar a aprendizagem associativa ou hebbiana , na qual a ativação simultânea de células leva a aumentos pronunciados na força sináptica entre essas células. Ele também fornece uma base biológica para métodos de aprendizagem sem erros para educação e reabilitação da memória. No estudo das redes neurais na função cognitiva, é frequentemente considerado como a base neuronal da aprendizagem não supervisionada .

Engramas Hebbian e teoria da montagem celular

A teoria Hebbian trata de como os neurônios podem se conectar para se tornarem engramas . As teorias de Hebb sobre a forma e função dos conjuntos de células podem ser entendidas a partir do seguinte:

A ideia geral é antiga, de que quaisquer duas células ou sistemas de células que estejam repetidamente ativos ao mesmo tempo tenderão a se tornar "associados", de modo que a atividade em uma facilita a atividade na outra.

Hebb também escreveu:

Quando uma célula ajuda repetidamente a disparar outra, o axônio da primeira célula desenvolve botões sinápticos (ou os aumenta, se já existirem) em contato com o soma da segunda célula.

[D. Alan Allport] apresenta ideias adicionais sobre a teoria da montagem celular e seu papel na formação de engramas, ao longo das linhas do conceito de autoassociação, descrito a seguir:

Se as entradas para um sistema fazem com que o mesmo padrão de atividade ocorra repetidamente, o conjunto de elementos ativos que constituem esse padrão se tornará cada vez mais fortemente interassociado. Ou seja, cada elemento tenderá a ligar todos os outros elementos e (com pesos negativos) a desligar os elementos que não fazem parte do padrão. Em outras palavras, o padrão como um todo se tornará 'autoassociado'. Podemos chamar um padrão aprendido (autoassociado) de engrama.

O trabalho no laboratório de Eric Kandel forneceu evidências para o envolvimento de mecanismos de aprendizagem Hebbian nas sinapses do gastrópode marinho Aplysia californica . Os experimentos sobre os mecanismos de modificação da sinapse Hebbian nas sinapses do sistema nervoso central de vertebrados são muito mais difíceis de controlar do que os experimentos com as sinapses do sistema nervoso periférico relativamente simples estudadas em invertebrados marinhos. Muito do trabalho sobre mudanças sinápticas de longa duração entre neurônios de vertebrados (como a potenciação de longo prazo ) envolve o uso de estimulação experimental não fisiológica de células cerebrais. No entanto, alguns dos mecanismos de modificação de sinapses fisiologicamente relevantes que foram estudados em cérebros de vertebrados parecem ser exemplos de processos Hebbianos. Um desses estudos analisa os resultados de experimentos que indicam que mudanças duradouras nas forças sinápticas podem ser induzidas pela atividade sináptica fisiologicamente relevante trabalhando por meio de mecanismos Hebbian e não Hebbian.

Princípios

Do ponto de vista dos neurônios artificiais e das redes neurais artificiais , o princípio de Hebb pode ser descrito como um método para determinar como alterar os pesos entre os neurônios modelo. O peso entre dois neurônios aumenta se os dois neurônios se ativam simultaneamente e diminui se eles se ativam separadamente. Os nós que tendem a ser positivos ou negativos ao mesmo tempo têm fortes pesos positivos, enquanto aqueles que tendem a ser opostos têm fortes pesos negativos.

O que se segue é uma descrição estereotipada da aprendizagem Hebbian: (muitas outras descrições são possíveis)

onde está o peso da conexão de neurônio a neurônio e a entrada de neurônio . Observe que este é um aprendizado de padrão (pesos atualizados após cada exemplo de treinamento). Em uma rede Hopfield , as conexões são definidas como zero se (nenhuma conexão reflexiva é permitida). Com neurônios binários (ativações 0 ou 1), as conexões seriam definidas como 1 se os neurônios conectados tivessem a mesma ativação para um padrão.

Quando vários padrões de treinamento são usados, a expressão se torna uma média de padrões individuais:

onde é o peso da conexão de neurônio a neurônio , é o número de padrões de treinamento, a ésima entrada para neurônio e <> é a média de todos os padrões de treinamento. Trata-se de aprendizagem por época (pesos atualizados após a apresentação de todos os exemplos de treinamento), sendo o último termo aplicável tanto a conjuntos de treinamento discreto como contínuo. Novamente, em uma rede Hopfield, as conexões são definidas como zero se (sem conexões reflexivas).

Uma variação do aprendizado Hebbian que leva em consideração fenômenos como bloqueio e muitos outros fenômenos de aprendizado neural é o modelo matemático de Harry Klopf . O modelo de Klopf reproduz muitos fenômenos biológicos e também é simples de implementar.

Relação com aprendizagem não supervisionada, estabilidade e generalização

Por causa da natureza simples do aprendizado Hebbian, baseado apenas na coincidência da atividade pré e pós-sináptica, pode não ser intuitivamente claro por que essa forma de plasticidade leva a um aprendizado significativo. No entanto, pode ser mostrado que a plasticidade Hebbian capta as propriedades estatísticas da entrada de uma forma que pode ser categorizada como aprendizagem não supervisionada.

Isso pode ser mostrado matematicamente em um exemplo simplificado. Vamos trabalhar sob a suposição simplificadora de um único neurônio de taxa baseado em taxa , cujas entradas têm taxas . A resposta do neurônio é geralmente descrita como uma combinação linear de sua entrada , seguida por uma função de resposta :

Conforme definido nas seções anteriores, a plasticidade Hebbian descreve a evolução no tempo do peso sináptico :

Assumindo, para simplificar, uma função de resposta de identidade , podemos escrever

ou em forma de matriz :

Como no capítulo anterior, se o treinamento por época for feito, uma média sobre o conjunto de treinamento discreto ou contínuo (tempo) pode ser feito:

onde é a matriz de correlação da entrada sob a suposição adicional de que (ou seja, a média das entradas é zero). Este é um sistema de equações diferenciais lineares acopladas. Por ser simétrico , também é diagonalizável , e a solução pode ser encontrada, trabalhando em sua base de vetores próprios, ser da forma

onde são constantes arbitrárias, são os autovetores de e seus correspondentes autovalores. Uma vez que uma matriz de correlação é sempre uma

matriz definida positiva , os autovalores são todos positivos e pode-se facilmente ver como a solução acima é sempre exponencialmente divergente no tempo. Este é um problema intrínseco devido a esta versão da regra de Hebb ser instável, pois em qualquer rede com um sinal dominante os pesos sinápticos irão aumentar ou diminuir exponencialmente. Intuitivamente, isso ocorre porque sempre que o neurônio pré-sináptico excita o neurônio pós-sináptico, o peso entre eles é reforçado, causando uma excitação ainda mais forte no futuro, e assim por diante, de forma auto-reforçada. Pode-se pensar que uma solução é limitar a taxa de disparo do neurônio pós-sináptico adicionando uma função de resposta saturante e não linear , mas, na verdade, pode-se mostrar que, para qualquer modelo de neurônio, a regra de Hebb é instável. Portanto, os modelos de rede de neurônios geralmente empregam outras teorias de aprendizagem, como a teoria BCM , a regra de Oja ou o algoritmo Hebbian generalizado .

Independentemente disso, mesmo para a solução instável acima, pode-se ver que, passado o tempo suficiente, um dos termos predomina sobre os outros, e

onde é o

maior autovalor de . Neste momento, o neurônio pós-sináptico realiza a seguinte operação:

Como, novamente, o autovetor corresponde ao maior autovalor da matriz de correlação entre os s, isso corresponde exatamente ao cálculo do primeiro

componente principal da entrada.

Este mecanismo pode ser estendido para realizar uma PCA completa (análise de componente principal) da entrada adicionando mais neurônios pós-sinápticos, desde que todos os neurônios pós-sinápticos sejam impedidos de captar o mesmo componente principal, por exemplo, adicionando inibição lateral na camada pós-sináptica. Assim, conectamos o aprendizado Hebbian ao PCA, que é uma forma elementar de aprendizado não supervisionado, no sentido de que a rede pode pegar aspectos estatísticos úteis da entrada e "descrevê-los" de uma forma destilada em sua saída.

Limitações

Apesar do uso comum de modelos Hebbian para potencialização de longo prazo, o princípio de Hebb não cobre todas as formas de plasticidade sináptica de longo prazo. Hebb não postulou nenhuma regra para sinapses inibitórias, nem fez previsões para sequências de pico anti-causais (o neurônio pré-sináptico dispara após o neurônio pós-sináptico). A modificação sináptica pode ocorrer não apenas entre os neurônios ativados A e B, mas também nas sinapses vizinhas. Todas as formas de

plasticidade heterossináptica e homeostática são, portanto, consideradas não hebianas. Um exemplo é a sinalização retrógrada para terminais pré-sinápticos. O composto mais comumente identificado como tendo esse papel de transmissor retrógrado é o óxido nítrico , que, devido à sua alta solubilidade e difusividade, freqüentemente exerce efeitos nos neurônios próximos. Este tipo de modificação sináptica difusa, conhecido como aprendizado de volume, não está incluído no modelo Hebbian tradicional.

Relato de aprendizagem Hebbian de neurônios-espelho

O aprendizado Hebbian e a plasticidade dependente do tempo de pico foram usados ​​em uma teoria influente de como os neurônios-espelho emergem. Os neurônios-espelho são neurônios que disparam quando um indivíduo realiza uma ação e quando o indivíduo vê ou ouve outro realizar uma ação semelhante. A descoberta desses neurônios tem sido muito influente para explicar como os indivíduos dão sentido às ações dos outros, ao mostrar que, quando uma pessoa percebe as ações dos outros, ela ativa os programas motores que usaria para realizar ações semelhantes. A ativação desses programas motores adiciona informações à percepção e ajuda a prever o que a pessoa fará a seguir, com base no próprio programa motor do observador. Um desafio tem sido explicar como os indivíduos passam a ter neurônios que respondem tanto ao realizar uma ação quanto ao ouvir ou ver outra pessoa realizar ações semelhantes.

Christian Keysers e David Perrett sugeriram que, à medida que um indivíduo realiza uma determinada ação, ele verá, ouvirá e sentirá a execução da ação. Esses sinais sensoriais re-aferentes irão desencadear atividade em neurônios que respondem à visão, som e sensação da ação. Como a atividade desses neurônios sensoriais irá se sobrepor consistentemente no tempo com a dos neurônios motores que causaram a ação, o aprendizado de Hebbian prevê que as sinapses que conectam os neurônios que respondem à visão, som e sensação de uma ação e aqueles dos neurônios que desencadeiam o a ação deve ser potencializada. O mesmo é verdade quando as pessoas se olham no espelho, se ouvem balbuciar ou são imitadas por outras pessoas. Após repetidas experiências dessa re-aferência, as sinapses conectando as representações sensoriais e motoras de uma ação são tão fortes que os neurônios motores começam a disparar ao som ou à visão da ação, e um neurônio espelho é criado.

A evidência dessa perspectiva vem de muitos experimentos que mostram que os programas motores podem ser desencadeados por novos estímulos auditivos ou visuais após o emparelhamento repetido do estímulo com a execução do programa motor (para uma revisão das evidências, ver Giudice et al., 2009 ) Por exemplo, pessoas que nunca tocaram piano não ativam as regiões do cérebro envolvidas em tocar piano ao ouvir música de piano. Cinco horas de aulas de piano, nas quais o participante é exposto ao som do piano cada vez que pressiona uma tecla, são suficientes para desencadear atividade nas regiões motoras do cérebro ao ouvir música de piano quando ouvida posteriormente. Consistente com o fato de que a plasticidade dependente do tempo de pico ocorre apenas se o disparo do neurônio pré-sináptico prediz o disparo do neurônio pós-sináptico, a ligação entre os estímulos sensoriais e os programas motores também parece ser potencializada apenas se o estímulo for contingente ao programa motor.

Veja também

Referências

Leitura adicional

links externos