Twitter sentiment analysis using n-grams approach and Deep Learning
Défense de mémoire de Cornet Rémi
Date : 19/06/2018 10:00 - 19/06/2018 11:00
Lieu : salle académique
Orateur(s) : Cornet Rémi
Organisateur(s) : Isabelle Daelman
Today, social networks and e-commerce platforms occupy a huge place in our society. These media are an important source of messages from users expressing an opinion or sentiment whether about an event or a commercial product. These subjective messages contain a wealth of information that is difficult to analyze manually and, for several years, a discipline has emerged that seeks to automate the analysis of this data: sentiment analysis. The Twitter micro-blogging platform, by its number of users and its number of daily messages is an interesting resource to work on this kind of content. In this document, existing sentiment analysis techniques are presented and various publications in the field are detailed. The main role of this document is to investigate the ability of an approach coupling neural networks and n-grams of messages posted on Twitter to provide good results as part of a sentence level sentiment classification. To achieve this objective, a pipeline was set up to cover all the operations required to carry out this experiment: data collection and cleaning, dataset preparation and training of the neural network.
Aujourd’hui, les réseaux sociaux et les plateformes de commerce électronique occupent une place énorme dans notre société. Ces médias sont une source importante de messages d’utilisateurs exprimant une opinion ou un sentiment, qu’il s’agisse d’un événement ou d’un produit commercial. Ces messages subjectifs contiennent une mine d’informations difficiles à analyser manuellement et, depuis plusieurs années, une discipline qui cherche à automatiser l’analyse de ces données a vu le jour : l’analyse des sentiments. La plateforme de micro-blogging Twitter, par son nombre d’utilisateurs et son nombre de messages quotidiens est une ressource intéressante pour travailler sur ce type de contenu. Dans ce document, les techniques d’analyse de sentiment existantes sont présentées et diverses publications sur le sujet sont détaillées. Le rôle principal de ce document est d’étudier la capacité d’une approche couplant l’utilisation des réseaux de neurones et de n-grammes de messages postés sur Twitter à fournir de bons résultats dans le cadre d’une classification des sentiments au niveau de la phrase. Pour atteindre cet objectif, un pipeline a été mis en place pour couvrir toutes les opérations nécessaires à la réalisation de cette expérience : collecte et nettoyage des données, préparation du jeu de données et entrainement du réseau de neurones.
Contact :
Isabelle Daelman
-
4966
-
isabelle.daelman@unamur.be
Télecharger :
vCal