ré-échantillonnage | Textes, Informatique, Multilinguisme

Détection automatique des signaux positifs de l’implication durable dans les conversations de consommateurs en parfumerie

La fouille d’opinions est un sujet exploité en TAL depuis longtemps. Néanmoins, au cours des dernières années, une simple détection d’opinion positive ou négative ne satisfait plus les chercheurs et les entreprises. Le monde des affaires est à la re- cherche d’un «aperçu des affaires». Beaucoup d’algorithmes d’apprentissage peuvent être utilisés pour traiter le problème. Cependant, leur performance en face de don- nées déséquilibrées, souvent rencontrées dans l’industrie, est dégradée en raison des caractéristiques complexes inhérentes de ce type de corpus. Notre travail se concentre sur l’étude des techniques visant à traiter la classification asymétrique afin de réali- ser notre projet en fouille d’opinions. Cinq méthodes ont été comparées : Smote, Ada- syn, Tomek links, Smote-TL et modification du poids de la classe. Notre algorithme conventionnel choisi est SVM et l’évaluation est réalisée par le calcul des scores de précision, de rappel, de f-mesure et du temps d’exécution. Le classifieur LSTM a aussi été testé comme expérience complémentaire. Selon les résultats expérimentaux, la méthode en ajustant le poids sur le coût, qui nous permet d’obtenir notre meilleur F- mesure 67.82% avec le moins de temps d’exécution, obtient la meilleure performance.

En savoir plus sur Détection automatique des signaux positifs de l’implication durable dans les conversations de consommateurs en parfumerie