Aprendizagem de transferência - Transfer learning

O aprendizado por transferência (TL) é um problema de pesquisa em aprendizado de máquina (ML) que se concentra em armazenar o conhecimento adquirido ao resolver um problema e aplicá-lo a um problema diferente, mas relacionado. Por exemplo, o conhecimento adquirido ao aprender a reconhecer carros pode ser aplicado ao tentar reconhecer caminhões. Esta área de pesquisa tem alguma relação com a longa história da literatura psicológica sobre transferência de aprendizagem , embora os laços práticos entre os dois campos sejam limitados. Do ponto de vista prático, reutilizar ou transferir informações de tarefas previamente aprendidas para o aprendizado de novas tarefas tem o potencial de melhorar significativamente a eficiência amostral de um agente de aprendizagem por reforço .

História

Em 1976, Stevo Bozinovski e Ante Fulgosi publicaram um artigo abordando explicitamente a aprendizagem por transferência no treinamento de redes neurais. O artigo apresenta um modelo matemático e geométrico de aprendizagem por transferência. Em 1981, foi apresentado um relatório sobre a aplicação da aprendizagem por transferência no treinamento de uma rede neural em um conjunto de dados de imagens representando letras de terminais de computador. A aprendizagem por transferência positiva e negativa foi demonstrada experimentalmente.

Em 1993, Lorien Pratt publicou um artigo sobre transferência em aprendizado de máquina , formulando o algoritmo de transferência baseada em discriminabilidade (DBT).

Em 1997, Pratt e Sebastian Thrun editaram como convidados uma edição especial do Aprendizado de Máquina dedicado ao aprendizado de transferência e, em 1998, o campo avançou para incluir o aprendizado de multitarefas , junto com uma análise mais formal de seus fundamentos teóricos. Learning to Learn , editado por Thrun e Pratt, é uma revisão de 1998 do assunto.

A aprendizagem por transferência também foi aplicada em ciências cognitivas , com Pratt também editando como convidado uma edição da Connection Science sobre a reutilização de redes neurais por meio de transferência em 1996.

Andrew Ng disse em seu tutorial do NIPS 2016 que o TL será o próximo impulsionador do sucesso comercial do ML após o aprendizado supervisionado para destacar a importância do TL.

Definição

A definição de transferência de aprendizagem é dada em termos de domínios e tarefas. Um domínio consiste em: um espaço de características e uma distribuição de probabilidade marginal , onde . Dado um domínio específico,, uma tarefa consiste em dois componentes: um espaço de rótulo e uma função preditiva objetiva . A função é usada para prever o rótulo correspondente de uma nova instância . Esta tarefa, denotada por , é aprendida a partir dos dados de treinamento que consistem em pares , onde e .

Dado um domínio de origem e tarefa de aprendizagem , um domínio de destino e tarefa de aprendizagem , onde , ou , a aprendizagem de transferência visa ajudar a melhorar a aprendizagem da função preditiva de destino ao usar o conhecimento em e .

Formulários

Algoritmos estão disponíveis para transferência de aprendizagem em redes lógicas de Markov e redes Bayesianas . A aprendizagem por transferência também foi aplicada à descoberta de subtipos de câncer, utilização de edifícios , jogos em geral , classificação de texto , reconhecimento de dígitos, imagens médicas e filtragem de spam .

Em 2020, foi descoberto que, devido às suas naturezas físicas semelhantes, a aprendizagem de transferência é possível entre eletromiográfica (EMG) sinais dos músculos ao classificar os comportamentos de eletroencefalográficas ondas cerebrais (EEG) a partir do reconhecimento de gestos de domínio para o domínio de reconhecimento estado mental. Observou-se também que essa relação funcionava vice-versa, mostrando que o EEG também pode ser usado para classificar EMG adicional. Os experimentos observaram que a precisão das redes neurais e redes neurais convolucionais foi melhorada por meio da aprendizagem de transferência, tanto na primeira época (antes de qualquer aprendizagem, ou seja, em comparação com a distribuição de peso aleatória padrão) e na assíntota (no final do processo de aprendizagem) . Ou seja, os algoritmos são aprimorados pela exposição a outro domínio. Além disso, o usuário final de um modelo pré-treinado pode alterar a estrutura de camadas totalmente conectadas para obter um desempenho superior.

Veja também

Referências

Origens