Análise de sentimentos - Sentiment analysis

A análise de sentimento (também conhecida como mineração de opinião ou IA emocional ) é o uso de processamento de linguagem natural , análise de texto , linguística computacional e biometria para identificar, extrair, quantificar e estudar estados afetivos e informações subjetivas de forma sistemática. A análise de sentimento é amplamente aplicada aos materiais de voz do cliente , como avaliações e respostas a pesquisas, mídia online e social, e materiais de saúde para aplicações que variam de marketing a atendimento ao cliente e medicina clínica.

Exemplos

O objetivo e os desafios da análise de sentimento podem ser mostrados por meio de alguns exemplos simples.

Casos simples

  • Coronet tem as melhores linhas de cruzeiros de um dia.
  • O Bertram tem um casco em V profundo e atravessa facilmente os mares.
  • Os cruzadores da Flórida em tons pastéis dos anos 80 são feios.
  • Não gosto de velhos cruzadores de cabine .

Exemplos mais desafiadores

  • Eu não gosto de cruzadores de cabine. ( Tratamento de negação )
  • Não gosto de embarcações realmente não é minha praia. (Negação, ordem invertida das palavras )
  • Às vezes eu realmente odeio RIBs . ( Adverbial modifica o sentimento)
  • Eu realmente adoraria sair com esse tempo! (Possivelmente sarcástico )
  • Chris Craft é mais bonito do que Limestone. (Duas marcas , identificar o alvo da atitude é difícil).
  • Chris Craft é mais bonito do que Limestone, mas Limestone projeta navegabilidade e confiabilidade. (Duas atitudes, duas marcas).
  • O filme é surpreendente, com muitas reviravoltas perturbadoras na trama. (Termo negativo usado em um sentido positivo em certos domínios).
  • Você deveria ver seu menu de sobremesas decadentes. (O termo de atitude mudou recentemente de polaridade em certos domínios)
  • Adoro o meu telemóvel, mas não o recomendaria a nenhum dos meus colegas. (Sentimento positivo qualificado, difícil de categorizar)
  • O show da próxima semana será koide9! ("Quoi de neuf?", Francês para "o que há de novo?". Termos recém-cunhados podem ser altamente atitudinais, mas voláteis em polaridade e muitas vezes fora do vocabulário conhecido.)

Tipos

Uma tarefa básica na análise de sentimento é classificar a polaridade de um determinado texto no nível do documento, frase ou característica / aspecto - se a opinião expressa em um documento, frase ou característica / aspecto de uma entidade é positiva, negativa ou neutra. A classificação de sentimento avançada, "além da polaridade", examina, por exemplo, estados emocionais como alegria, raiva, nojo, tristeza, medo e surpresa.

Os precursores da análise sentimental incluem o General Inquirer, que forneceu dicas para a quantificação de padrões no texto e, separadamente, a pesquisa psicológica que examinou o estado psicológico de uma pessoa com base na análise de seu comportamento verbal.

Posteriormente, o método descrito em uma patente de Volcani e Fogel, olhou especificamente para o sentimento e identificou palavras e frases individuais no texto com relação a diferentes escalas emocionais. Um sistema atual baseado em seu trabalho, denominado EffectCheck, apresenta sinônimos que podem ser usados ​​para aumentar ou diminuir o nível de emoção evocada em cada escala.

Muitos outros esforços subsequentes foram menos sofisticados, usando uma mera visão polar do sentimento, do positivo ao negativo, como o trabalho de Turney e Pang, que aplicaram métodos diferentes para detectar a polaridade das críticas de produtos e filmes, respectivamente. Este trabalho está no nível do documento. Também se pode classificar a polaridade de um documento em uma escala de múltiplas vias, o que foi tentado por Pang e Snyder entre outros: Pang e Lee expandiram a tarefa básica de classificar uma crítica de filme como positiva ou negativa para prever a classificação por estrelas em um 3 ou uma escala de 4 estrelas, enquanto Snyder realizava uma análise aprofundada das críticas de restaurantes, prevendo classificações para vários aspectos de um determinado restaurante, como a comida e a atmosfera (em uma escala de cinco estrelas).

Os primeiros passos para reunir várias abordagens - aprendizagem, lexical, baseada no conhecimento, etc. - foram dados no Simpósio Primavera AAAI de 2004, onde linguistas, cientistas da computação e outros pesquisadores interessados ​​primeiro alinharam interesses e propuseram tarefas compartilhadas e conjuntos de dados de referência para o pesquisa computacional sistemática sobre afeto, apelo, subjetividade e sentimento no texto.

Embora na maioria dos métodos de classificação estatística, a classe neutra seja ignorada sob a suposição de que os textos neutros estão próximos da fronteira do classificador binário, vários pesquisadores sugerem que, como em todo problema de polaridade, três categorias devem ser identificadas. Além disso, pode ser comprovado que classificadores específicos, como Max Entropy e SVMs, podem se beneficiar da introdução de uma classe neutra e melhorar a precisão geral da classificação. Existem, em princípio, duas maneiras de operar com uma classe neutra. Ou, o algoritmo prossegue identificando primeiro a linguagem neutra, filtrando-a e, em seguida, avaliando o resto em termos de sentimentos positivos e negativos, ou constrói uma classificação de três vias em uma etapa. Esta segunda abordagem frequentemente envolve estimar uma distribuição de probabilidade sobre todas as categorias (por exemplo, classificadores Bayes ingênuos implementados pelo NLTK ). Se e como usar uma classe neutra depende da natureza dos dados: se os dados estiverem claramente agrupados em linguagem neutra, negativa e positiva, faz sentido filtrar a linguagem neutra e focar na polaridade entre sentimentos positivos e negativos. Se, em contraste, os dados são em sua maioria neutros com pequenos desvios em direção ao afeto positivo e negativo, esta estratégia tornaria mais difícil distinguir claramente entre os dois pólos.

Um método diferente para determinar o sentimento é o uso de um sistema de escala em que as palavras comumente associadas a um sentimento negativo, neutro ou positivo recebem um número associado em uma escala de −10 a +10 (do mais negativo até o mais positivo) ou simplesmente de 0 a um limite superior positivo, como +4. Isso torna possível ajustar o sentimento de um determinado termo em relação ao seu ambiente (geralmente no nível da frase). Quando um trecho de texto não estruturado é analisado usando o processamento de linguagem natural , cada conceito no ambiente especificado recebe uma pontuação com base na maneira como as palavras de sentimento se relacionam com o conceito e sua pontuação associada. Isso permite o movimento para uma compreensão mais sofisticada do sentimento, pois agora é possível ajustar o valor do sentimento de um conceito em relação às modificações que podem envolvê-lo. Palavras, por exemplo, que intensificam, relaxam ou negam o sentimento expresso pelo conceito podem afetar sua pontuação. Como alternativa, os textos podem receber uma pontuação de força de sentimento positiva e negativa se o objetivo for determinar o sentimento em um texto, em vez da polaridade e força geral do texto.

Existem vários outros tipos de análise de sentimento, como análise de sentimento baseada em aspectos, análise de sentimento de classificação (positivo, negativo, neutro), análise de sentimento multilíngue e detecção de emoções.

Identificação de subjetividade / objetividade

Essa tarefa é comumente definida como classificar um determinado texto (geralmente uma frase) em uma de duas classes: objetivo ou subjetivo. Este problema às vezes pode ser mais difícil do que a classificação de polaridade. A subjetividade de palavras e frases pode depender de seu contexto e um documento objetivo pode conter sentenças subjetivas (por exemplo, um artigo de notícias citando as opiniões das pessoas). Além disso, como mencionado por Su, os resultados são amplamente dependentes da definição de subjetividade usada ao fazer anotações em textos. No entanto, Pang mostrou que remover sentenças objetivas de um documento antes de classificar sua polaridade ajudava a melhorar o desempenho.

Identificação subjetiva e objetiva, subtarefas emergentes de análise de sentimento para usar recursos sintáticos, semânticos e conhecimento de aprendizado de máquina para identificar uma frase ou documento são fatos ou opiniões. A consciência do reconhecimento de fatos e opiniões não é recente, tendo sido apresentada pela primeira vez por Carbonell na Universidade de Yale em 1979.

O termo objetivo refere-se ao incidente transportar informações factuais.

  • Exemplo de uma frase objetiva: 'Para ser eleito presidente dos Estados Unidos, um candidato deve ter pelo menos trinta e cinco anos de idade.'

O termo subjetivo descreve que o incidente contém informações não factuais em várias formas, como opiniões pessoais, julgamentos e previsões. Também conhecidos como 'estados privados' mencionados por Quirk et al. No exemplo abaixo, ele reflete um estado privado 'Nós, Americanos'. Além disso, a entidade-alvo comentada pelas opiniões pode assumir várias formas, desde produtos tangíveis a assuntos de tópicos intangíveis, afirmados em Liu (2010). Além disso, três tipos de atitudes foram observados por Liu (2010), 1) opiniões positivas, 2) opiniões neutras e 3) opiniões negativas.

  • Exemplo de uma frase subjetiva: 'Nós, americanos, precisamos eleger um presidente que seja maduro e que seja capaz de tomar decisões sábias'.

Esta análise é um problema de classificação.

As coleções de palavras ou indicadores de frase de cada classe são definidas para localizar padrões desejáveis ​​em texto não anotado. Para a expressão subjetiva, uma lista de palavras diferente foi criada. Listas de indicadores subjetivos em palavras ou frases foram desenvolvidas por vários pesquisadores nos estados do campo linguístico e de processamento de linguagem natural em Riloff et al. (2003). Um dicionário de regras de extração deve ser criado para medir determinadas expressões. Com o passar dos anos, na detecção subjetiva, a progressão da extração de recursos de curadoria de recursos manualmente em 1999 para o aprendizado automatizado de recursos em 2005. No momento, os métodos de aprendizado automatizado podem se separar ainda mais em aprendizado de máquina supervisionado e não supervisionado . A extração de padrões com texto anotado e não anotado do processo de aprendizado de máquina foi explorada extensivamente por pesquisadores acadêmicos.

No entanto, os pesquisadores reconheceram vários desafios no desenvolvimento de conjuntos fixos de regras para expressões de forma respeitável. Muitos dos desafios no desenvolvimento de regras derivam da natureza das informações textuais. Seis desafios foram reconhecidos por vários pesquisadores: 1) expressões metafóricas, 2) discrepâncias na escrita, 3) sensíveis ao contexto, 4) palavras representadas com menos usos, 5) sensíveis ao tempo e 6) volume sempre crescente.

  1. Expressões metafóricas. O texto contém expressão metafórica que pode impactar no desempenho na extração. Além disso, as metáforas assumem diferentes formas, o que pode ter contribuído para o aumento da detecção.
  2. Discrepâncias nas escritas. Para o texto obtido na Internet, as discrepâncias no estilo de escrita dos dados do texto direcionado envolvem gêneros e estilos de escrita distintos
  3. Sensível ao contexto. A classificação pode variar com base na subjetividade ou objetividade das frases anteriores e posteriores.
  4. Atributo sensível ao tempo. A tarefa é desafiada pelo atributo sensível ao tempo de alguns dados textuais. Se um grupo de pesquisadores quer confirmar um fato nas notícias, eles precisam de mais tempo para a validação cruzada, para que a notícia fique desatualizada.
  5. Palavras-chave com menos utilizações.
  6. Volume cada vez maior. A tarefa também é desafiada pelo grande volume de dados textuais. A natureza cada vez maior dos dados textuais torna a tarefa extremamente difícil para os pesquisadores concluírem a tarefa a tempo.

Anteriormente, a pesquisa se concentrava principalmente na classificação em nível de documento. No entanto, a classificação de um nível de documento sofre menos precisão, pois um artigo pode ter diversos tipos de expressões envolvidas. A pesquisa de evidências sugere um conjunto de artigos de notícias que se espera que dominem pela expressão objetiva, enquanto os resultados mostram que consistia em mais de 40% de expressão subjetiva.

Para superar esses desafios, os pesquisadores concluem que a eficácia do classificador depende da precisão dos padrões do aluno. E os feeds do aluno com grandes volumes de dados de treinamento anotados superaram aqueles treinados em recursos subjetivos menos abrangentes. No entanto, um dos principais obstáculos para a execução desse tipo de trabalho é a geração manual de um grande conjunto de dados de frases anotadas. O método de anotação manual tem sido menos favorecido do que o aprendizado automático por três motivos:

  1. Variações em compreensões. Na tarefa de anotação manual, o desacordo sobre se uma instância é subjetiva ou objetiva pode ocorrer entre os anotadores devido à ambigüidade da linguagem.
  2. Erros humanos. A tarefa de anotação manual é uma tarefa meticulosa e requer concentração intensa para ser concluída.
  3. Demorado. A tarefa de anotação manual é um trabalho assíduo. Riloff (1996) mostra que 160 textos custam 8 horas para um anotador terminar.

Todas essas razões mencionadas podem impactar na eficiência e eficácia da classificação subjetiva e objetiva. Assim, dois métodos de bootstrapping foram projetados para aprender padrões linguísticos a partir de dados de texto não anotados. Ambos os métodos começam com um punhado de palavras-semente e dados textuais não anotados.

  1. Meta-Bootstrapping por Riloff e Jones em 1999. Nível Um: Gerar padrões de extração com base nas regras predefinidas e os padrões extraídos pelo número de palavras-semente que cada padrão contém. Nível dois: as 5 palavras principais serão marcadas e adicionadas ao dicionário. Repetir.
  2. Basilisk ( B ootstrapping A pproach to S emantic L exicon I nduction using S emantic K nowledge) por Thelen e Riloff. Etapa um: gerar padrões de extração. Etapa dois: mover os melhores padrões do pool de padrões para o pool de palavras candidatas. Etapa três: as 10 palavras principais serão marcadas e adicionadas ao dicionário. Repetir.

No geral, esses algoritmos destacam a necessidade de reconhecimento automático de padrões e extração em tarefas subjetivas e objetivas.

O classificador subjetivo e de objeto pode aprimorar as aplicações servais de processamento de linguagem natural. Um dos principais benefícios do classificador é que ele popularizou a prática de processos de tomada de decisão baseados em dados em vários setores. De acordo com Liu, as aplicações da identificação subjetiva e objetiva foram implementadas nos negócios, publicidade, esportes e ciências sociais.

  • Classificação da revisão online: no setor de negócios, o classificador ajuda a empresa a entender melhor os feedbacks sobre o produto e os raciocínios por trás das revisões.
  • Previsão do preço das ações: no setor financeiro, o classier auxilia o modelo de previsão processando informações auxiliares das mídias sociais e outras informações textuais da Internet. Estudos anteriores sobre o preço das ações japonesas conduzidos por Dong et.al. indica que o modelo com módulo subjetivo e objetivo pode ter um desempenho melhor do que aqueles sem esta parte.
  • Análise de mídia social.
  • Classificação do feedback dos alunos.
  • Resumo de documentos: O classificador pode extrair comentários específicos do alvo e reunir opiniões feitas por uma entidade particular.
  • Resposta a perguntas complexas. O classificador pode dissecar as questões complexas classificando o assunto da linguagem ou objetivo e alvo focado. Na pesquisa Yu et al. (2003), o pesquisador desenvolveu uma frase e um nível de documento agrupados que peças de opinião de identidade.
  • Aplicativos específicos de domínio.
  • Análise de e-mail: o classificador subjetivo e objetivo detecta spam rastreando padrões de linguagem com palavras-alvo.

Baseado em recurso / aspecto

Refere-se a determinar as opiniões ou sentimentos expressos sobre diferentes recursos ou aspectos de entidades, por exemplo, de um telefone celular, uma câmera digital ou um banco. Um recurso ou aspecto é um atributo ou componente de uma entidade, por exemplo, a tela de um telefone celular, o serviço de um restaurante ou a qualidade da imagem de uma câmera. A vantagem da análise de sentimento baseada em recursos é a possibilidade de capturar nuances sobre objetos de interesse. Diferentes características podem gerar diferentes respostas de sentimento, por exemplo, um hotel pode ter uma localização conveniente, mas comida medíocre. Esse problema envolve vários subproblemas, por exemplo, identificar entidades relevantes, extrair suas características / aspectos e determinar se uma opinião expressa sobre cada característica / aspecto é positiva, negativa ou neutra. A identificação automática de recursos pode ser realizada com métodos sintáticos, com modelagem de tópicos ou com aprendizado profundo . Discussões mais detalhadas sobre este nível de análise de sentimento podem ser encontradas no trabalho de Liu.

Métodos e recursos

As abordagens existentes para a análise de sentimento podem ser agrupadas em três categorias principais: técnicas baseadas no conhecimento, métodos estatísticos e abordagens híbridas. As técnicas baseadas no conhecimento classificam o texto por categorias de afeto com base na presença de palavras de afeto inequívocas, como feliz, triste, com medo e entediado. Algumas bases de conhecimento não apenas listam palavras de afeto óbvias, mas também atribuem a palavras arbitrárias uma provável "afinidade" com emoções específicas. Os métodos estatísticos aproveitam elementos do aprendizado de máquina , como análise semântica latente , máquinas de vetores de suporte , " saco de palavras ", " Informações mútuas pontuais " para orientação semântica e aprendizado profundo . Métodos mais sofisticados tentam detectar o detentor de um sentimento (ou seja, a pessoa que mantém aquele estado afetivo) e o alvo (ou seja, a entidade sobre a qual o afeto é sentido). Para minerar a opinião no contexto e obter a característica sobre a qual o falante opinou, são usadas as relações gramaticais das palavras. As relações de dependência gramaticais são obtidas por análise profunda do texto. As abordagens híbridas aproveitam tanto o aprendizado de máquina quanto os elementos da representação do conhecimento , como ontologias e redes semânticas , a fim de detectar semânticas que são expressas de maneira sutil, por exemplo, por meio da análise de conceitos que não transmitem informações relevantes explicitamente, mas que estão implicitamente vinculados a outros conceitos que o fazem.

Ferramentas de software de código aberto, bem como uma variedade de ferramentas de análise de sentimento gratuitas e pagas, implantam aprendizado de máquina , estatísticas e técnicas de processamento de linguagem natural para automatizar a análise de sentimento em grandes coleções de textos, incluindo páginas da web, notícias online, grupos de discussão na Internet, análises online, blogs da web e mídia social. Os sistemas baseados no conhecimento, por outro lado, fazem uso de recursos disponíveis publicamente, para extrair a informação semântica e afetiva associada aos conceitos de linguagem natural. O sistema pode ajudar a realizar o raciocínio afetivo do senso comum . A análise de sentimento também pode ser realizada no conteúdo visual, ou seja, imagens e vídeos (consulte Análise de sentimento multimodal ). Uma das primeiras abordagens nessa direção é o SentiBank, utilizando uma representação de par de substantivos adjetivo de conteúdo visual. Além disso, a grande maioria das abordagens de classificação de sentimento baseia-se no modelo de saco de palavras, que desconsidera o contexto, a gramática e até mesmo a ordem das palavras . Abordagens que analisam o sentimento com base em como as palavras compõem o significado de frases mais longas apresentam melhor resultado, mas incorrem em uma sobrecarga de anotação adicional.

Um componente de análise humana é necessário na análise de sentimento, pois os sistemas automatizados não são capazes de analisar tendências históricas do comentador individual ou da plataforma e muitas vezes são classificados incorretamente em seus sentimentos expressos. A automação afeta aproximadamente 23% dos comentários que são classificados corretamente por humanos. No entanto, os humanos frequentemente discordam, e argumenta-se que o acordo inter-humano fornece um limite superior que os classificadores de sentimento automatizados podem eventualmente alcançar.

Avaliação

A precisão de um sistema de análise de sentimento é, em princípio, quão bem ele concorda com os julgamentos humanos. Isso geralmente é medido por medidas variantes com base na precisão e recall nas duas categorias de destino de textos negativos e positivos. No entanto, de acordo com a pesquisa, os avaliadores humanos normalmente concordam apenas cerca de 80% das vezes (consulte Confiabilidade entre avaliadores ). Portanto, um programa que atinge 70% de precisão na classificação de sentimento está se saindo quase tão bem quanto os humanos, embora essa precisão possa não parecer impressionante. Se um programa estivesse "certo" 100% das vezes, os humanos ainda discordariam dele cerca de 20% das vezes, uma vez que discordam tanto sobre qualquer resposta.

Por outro lado, os sistemas de computador cometerão erros muito diferentes dos avaliadores humanos e, portanto, os números não são inteiramente comparáveis. Por exemplo, um sistema de computador terá problemas com negações, exageros, piadas ou sarcasmo, que normalmente são fáceis de lidar para um leitor humano: alguns erros que um sistema de computador comete parecerão excessivamente ingênuos para um humano. Em geral, a utilidade para tarefas comerciais práticas de análise de sentimento, conforme definido na pesquisa acadêmica, foi questionada, principalmente porque o modelo unidimensional simples de sentimento de negativo para positivo produz pouca informação acionável para um cliente preocupado com o efeito do discurso público sobre, por exemplo, a marca ou a reputação corporativa.

Para atender melhor às necessidades do mercado, a avaliação da análise de sentimento mudou para medidas mais baseadas em tarefas, formuladas em conjunto com representantes de agências de RP e profissionais de pesquisa de mercado. O foco, por exemplo, no conjunto de dados de avaliação RepLab é menos no conteúdo do texto em consideração e mais no efeito do texto em questão na reputação da marca .

Como a avaliação da análise de sentimento está se tornando cada vez mais baseada em tarefas, cada implementação precisa de um modelo de treinamento separado para obter uma representação mais precisa do sentimento para um determinado conjunto de dados.

Web 2.0

A ascensão das mídias sociais , como blogs e redes sociais , alimentou o interesse pela análise de sentimento. Com a proliferação de avaliações, avaliações, recomendações e outras formas de expressão online, a opinião online se tornou uma espécie de moeda virtual para empresas que buscam comercializar seus produtos, identificar novas oportunidades e gerenciar sua reputação. À medida que as empresas procuram automatizar o processo de filtragem do ruído, compreensão das conversas, identificação do conteúdo relevante e ação apropriada, muitas agora estão olhando para o campo da análise de sentimento. Para complicar ainda mais a questão, é o surgimento de plataformas anônimas de mídia social, como 4chan e Reddit . Se a web 2.0 visava democratizar a publicação, o próximo estágio da web pode muito bem ser baseado na democratização da mineração de dados de todo o conteúdo que está sendo publicado.

Um passo nesse sentido é realizado na pesquisa. Diversas equipes de pesquisa em universidades ao redor do mundo atualmente se concentram na compreensão da dinâmica do sentimento em comunidades eletrônicas por meio da análise de sentimento. O projeto CyberEmotions , por exemplo, recentemente identificou o papel das emoções negativas na condução das discussões nas redes sociais.

O problema é que a maioria dos algoritmos de análise de sentimento usa termos simples para expressar o sentimento sobre um produto ou serviço. No entanto, fatores culturais, nuances linguísticas e contextos diferentes tornam extremamente difícil transformar uma sequência de texto escrito em um simples pró ou con sentimento. O fato de os humanos frequentemente discordarem quanto ao sentimento do texto ilustra como é grande a tarefa dos computadores fazer isso da maneira certa. Quanto mais curta for a sequência de texto, mais difícil se tornará.

Mesmo que cadeias de texto curtas possam ser um problema, a análise de sentimento dentro do microblog mostrou que o Twitter pode ser visto como um indicador online válido de sentimento político. O sentimento político dos tweets demonstra correspondência próxima a posições políticas de partidos e políticos, indicando que o conteúdo das mensagens do Twitter reflete de forma plausível o cenário político off-line. Além disso, a análise de sentimento no Twitter também demonstrou capturar o humor do público por trás dos ciclos de reprodução humana em todo o mundo, bem como outros problemas de relevância para a saúde pública, como reações adversas a medicamentos.

Embora a análise de sentimento tenha sido popular em domínios onde os autores expressam suas opiniões de forma bastante explícita ("o filme é incrível"), como mídia social e análises de produtos, apenas recentemente métodos robustos foram desenvolvidos para outros domínios onde o sentimento é fortemente implícito ou indireto. Por exemplo, em artigos de notícias - principalmente devido à objetividade jornalística esperada - os jornalistas costumam descrever ações ou eventos, em vez de afirmar diretamente a polaridade de uma informação. Abordagens anteriores usando dicionários ou recursos de aprendizado de máquina rasos sofreram por não serem capazes de capturar o "significado nas entrelinhas", mas recentemente os pesquisadores propuseram uma abordagem baseada em aprendizagem profunda e um conjunto de dados para ser capaz de analisar o sentimento em artigos de notícias.

Aplicação em sistemas de recomendação

Para um sistema de recomendação , a análise de sentimento provou ser uma técnica valiosa. Um sistema de recomendação visa prever a preferência por um item de um usuário-alvo. Os principais sistemas de recomendação funcionam em conjuntos de dados explícitos. Por exemplo, a filtragem colaborativa funciona na matriz de classificação e a filtragem baseada em conteúdo funciona nos metadados dos itens.

Em muitos serviços de rede social ou sites de comércio eletrônico, os usuários podem fornecer revisão de texto, comentário ou feedback sobre os itens. Este texto gerado pelo usuário fornece uma fonte rica de opiniões de sentimento do usuário sobre vários produtos e itens. Potencialmente, para um item, esse texto pode revelar a característica / aspectos relacionados do item e os sentimentos dos usuários sobre cada característica. As características / aspectos do item descritos no texto desempenham o mesmo papel com os metadados na filtragem baseada em conteúdo , mas os primeiros são mais valiosos para o sistema de recomendação. Uma vez que esses recursos são amplamente mencionados pelos usuários em suas avaliações, eles podem ser vistos como os recursos mais cruciais que podem influenciar significativamente a experiência do usuário no item, enquanto os metadados do item (geralmente fornecidos pelos produtores em vez dos consumidores) pode ignorar recursos que são preocupados pelos usuários. Para itens diferentes com características comuns, um usuário pode dar opiniões diferentes. Além disso, uma característica do mesmo item pode receber opiniões diferentes de usuários diferentes. Os sentimentos dos usuários sobre os recursos podem ser considerados como uma pontuação de classificação multidimensional, refletindo sua preferência nos itens.

Com base na característica / aspectos e nos sentimentos extraídos do texto gerado pelo usuário, um sistema de recomendação híbrido pode ser construído. Existem dois tipos de motivação para recomendar um item candidato a um usuário. A primeira motivação é que o item candidato tem várias características comuns com os itens preferidos do usuário, enquanto a segunda motivação é que o item candidato recebe um sentimento elevado em suas características. Para um item preferido, é razoável acreditar que os itens com as mesmas características terão uma função ou utilidade semelhante. Portanto, esses itens provavelmente também serão preferidos pelo usuário. Por outro lado, para uma característica compartilhada de dois itens candidatos, outros usuários podem dar um sentimento positivo a um deles enquanto dão um sentimento negativo a outro. Claramente, o item de alta avaliação deve ser recomendado ao usuário. Com base nessas duas motivações, uma pontuação de classificação de combinação de similaridade e avaliação de sentimento pode ser construída para cada item candidato.

Exceto pela dificuldade da própria análise de sentimento, a aplicação da análise de sentimento em avaliações ou feedback também enfrenta o desafio de spam e avaliações tendenciosas. Uma direção de trabalho concentra-se em avaliar a utilidade de cada revisão. Comentário ou feedback mal escrito dificilmente é útil para o sistema de recomendação. Além disso, uma revisão pode ser elaborada para dificultar as vendas de um produto-alvo, podendo ser prejudicial ao sistema de recomendação, mesmo que seja bem escrita.

Os pesquisadores também descobriram que as formas longas e curtas de texto gerado pelo usuário devem ser tratadas de maneira diferente. Um resultado interessante mostra que as revisões curtas às vezes são mais úteis do que as longas, porque é mais fácil filtrar o ruído em um texto curto. Para o texto longo, o comprimento crescente do texto nem sempre traz um aumento proporcional no número de características ou sentimentos no texto.

Lamba & Madhusudhan introduzem uma maneira nascente de atender às necessidades de informação dos usuários de bibliotecas de hoje, reempacotando os resultados da análise de sentimento de plataformas de mídia social como o Twitter e fornecendo-os como um serviço baseado em tempo consolidado em diferentes formatos. Além disso, eles propõem uma nova maneira de conduzir o marketing em bibliotecas usando mineração de mídia social e análise de sentimento.

Veja também

Referências