Aumento de dados - Data augmentation

O aumento de dados na análise de dados são técnicas usadas para aumentar a quantidade de dados adicionando cópias ligeiramente modificadas de dados já existentes ou dados sintéticos recém-criados a partir de dados existentes. Ele atua como um regularizador e ajuda a reduzir o sobreajuste ao treinar um modelo de aprendizado de máquina. Está intimamente relacionado à sobreamostragem na análise de dados.

Técnicas de sobreamostragem sintética para aprendizado de máquina tradicional

Aumento de dados para classificação de imagens

Transformações de imagens

A biblioteca Augmentor apresenta transformações elásticas para gerar novas imagens sintéticas a partir de um conjunto de dados para aliviar os problemas de escassez.

Transformações geométricas, inversão, modificação de cor, recorte, rotação, injeção de ruído e apagamento aleatório são usados ​​para aumentar a imagem no aprendizado profundo.

Apresentando novas imagens sintéticas

Se o problema da escassez de dados for enfrentado, as técnicas simples, mas eficazes, como as transformações, podem representar uma solução limitada. Se um conjunto de dados for muito pequeno, um conjunto de imagens transformadas por meio de rotação e espelhamento, etc., ainda pode ser muito pequeno para um determinado problema. Outra solução é o fornecimento de imagens inteiramente novas e sintéticas por meio de várias técnicas, por exemplo, o uso de redes adversárias gerativas para criar novas imagens sintéticas para aumento de dados. Além disso, os algoritmos de reconhecimento de imagem apresentam melhorias ao transferir de imagens sintéticas geradas pelo Unity Game Engine, ou seja, para melhorar o aprendizado de dados do mundo real, aumentando o processo de treinamento com imagens renderizadas de ambientes virtuais.

Aumento de dados para processamento de sinal

O bootstrap residual ou em bloco pode ser usado para o aumento da série temporal.

Sinais biológicos

O aumento de dados sintéticos é de suma importância para a classificação do aprendizado de máquina, principalmente para dados biológicos, que tendem a ser altamente dimensionais e escassos. As aplicações de controle robótico e aumento em indivíduos com deficiência e sem deficiência ainda dependem principalmente de análises específicas do assunto. A escassez de dados é notável em problemas de processamento de sinal, como os sinais de eletromiografia da doença de Parkinson , que são difíceis de obter - Zanini, et al. observou que é possível usar uma rede adversarial gerativa (em particular, um DCGAN) para realizar a transferência de estilo a fim de gerar sinais eletromiográficos sintéticos que correspondam aos exibidos por pessoas que sofrem da doença de Parkinson.

As abordagens também são importantes na eletroencefalografia (ondas cerebrais). Wang, et al. explorou a ideia de usar redes neurais convolucionais profundas para reconhecimento de emoção baseado em EEG, os resultados mostram que o reconhecimento de emoção foi melhorado quando o aumento de dados foi usado.

Uma comparação de sinais de EEG gerados por GPT-2 (esquerda) e ondas cerebrais humanas reais (direita) nas classes de estado mental "Concentrado", "Relaxado" e "Neutro".

Também foi observado que o modelo GPT-2 da OpenAI é capaz de aprender e gerar sinais biológicos sintéticos, como EEG e EMG. Neste estudo, observou-se que o reconhecimento foi melhorado por meio do aumento de dados. Também foi observado que modelos estatísticos de aprendizado de máquina treinados no domínio sintético podem classificar os dados humanos e vice-versa. Na imagem, uma comparação é dada por alguns exemplos de EEG produzidos pelo modelo GPT-2 e um cérebro humano.

Uma abordagem comum é gerar sinais sintéticos reorganizando componentes de dados reais. Lotte propôs um método de "Geração de Ensaio Artificial Baseado na Analogia", onde três exemplos de dados fornecem exemplos e um artificial é formado que é para o que é . Uma transformação é aplicada para torná-lo mais semelhante a , a mesma transformação é então aplicada a que gera . Esta abordagem mostrou melhorar o desempenho de um classificador de Análise Discriminante Linear em três conjuntos de dados diferentes.

A pesquisa atual mostra que um grande impacto pode ser derivado de técnicas relativamente simples. Por exemplo, Freer observou que a introdução de ruído nos dados coletados para formar pontos de dados adicionais melhorou a capacidade de aprendizado de vários modelos que, de outra forma, tiveram um desempenho relativamente ruim. Tsinganos et al. estudaram as abordagens de deformação de magnitude, decomposição de wavelet e modelos de EMG de superfície sintética (abordagens gerativas) para reconhecimento de gestos manuais, encontrando aumentos de desempenho de classificação de até + 16% quando dados aumentados foram introduzidos durante o treinamento. Mais recentemente, os estudos de aumento de dados começaram a se concentrar no campo do aprendizado profundo, mais especificamente na capacidade dos modelos generativos de criar dados artificiais que são então introduzidos durante o processo de treinamento do modelo de classificação. Em 2018, Luo et al. observaram que dados de sinal de EEG úteis poderiam ser gerados por Redes Adversariais Gerativas de Wasserstein condicionais (GANs), que foram então introduzidas no conjunto de treinamento em uma estrutura clássica de aprendizado de teste de trem. Os autores descobriram que o desempenho da classificação melhorou quando tais técnicas foram introduzidas.

Aumento de dados para reconhecimento de voz

Foi notado que a geração de dados sintéticos de MFCCs falados pode melhorar o reconhecimento de um falante a partir de suas declarações por meio da aprendizagem de transferência de dados sintéticos que foram gerados por meio de uma Rede Neural Recorrente em nível de caractere (RNN).

Veja também

Referências