plongements lexicaux

Génération de ressources pour la fouille d’opinions. Comparaison d’approches et évaluations

Résumé
Ce mémoire décrit la constitution automatique de ressources génériques destinées à des applications de fouilles d’opinions. Nous définissons des typologies pour des ressources de polarités générales, d’émotions et d’outils linguistiques. Nous adoptons alors trois méthodes pour la génération de ressources: une méthode de propagation d’informations linguistiques à travers un réseau sémantique, une méthode statistique d’estimation de polarité sur corpus et une méthode semi-automatique à l’aide de plongements lexicaux. Nous utilisons un corpus d’avis clients dans les domaines du multimédia et de la librairie, de la beauté et de l’ameublement. Les résultats obtenus sont prometteurs et sont meilleurs pour les ressources de polarités plutôt que d’émotions. Afin d’évaluer la qualité des ressources générées, nous mettons en place un protocole d’évaluation complet en menant des évaluations par comparaison à une ressource de référence, des évaluations humaines ainsi qu’une évaluation dans un contexte applicatif concret.