fouille d’opinions https://ertim.inalco.fr/ fr Génération de ressources pour la fouille d’opinions. Comparaison d’approches et évaluations https://ertim.inalco.fr/node/714 <span class="field field--name-title field--type-string field--label-hidden">Génération de ressources pour la fouille d’opinions. Comparaison d’approches et évaluations</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 02/02/2021 - 11:44</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Clémence Laurent</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2020</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire décrit la constitution automatique de ressources génériques destinées à des applications de fouilles d’opinions. Nous définissons des typologies pour des ressources de polarités générales, d’émotions et d’outils linguistiques. Nous adoptons alors trois méthodes pour la génération de ressources: une méthode de propagation d’informations linguistiques à travers un réseau sémantique, une méthode statistique d’estimation de polarité sur corpus et une méthode semi-automatique à l’aide de plongements lexicaux. Nous utilisons un corpus d’avis clients dans les domaines du multimédia et de la librairie, de la beauté et de l’ameublement. Les résultats obtenus sont prometteurs et sont meilleurs pour les ressources de polarités plutôt que d’émotions. Afin d’évaluer la qualité des ressources générées, nous mettons en place un protocole d’évaluation complet en menant des évaluations par comparaison à une ressource de référence, des évaluations humaines ainsi qu’une évaluation dans un contexte applicatif concret.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2420" hreflang="fr">fouille d’opinions</a></div> <div class="field__item"><a href="/taxonomy/term/2654" hreflang="fr">ressources génériques</a></div> <div class="field__item"><a href="/taxonomy/term/2655" hreflang="fr">réseau sémantique</a></div> <div class="field__item"><a href="/taxonomy/term/2656" hreflang="fr">plongements lexicaux</a></div> <div class="field__item"><a href="/taxonomy/term/2657" hreflang="fr">protocole d’évaluation</a></div> </div> </div> Tue, 02 Feb 2021 10:44:04 +0000 gestionnaire 714 at https://ertim.inalco.fr Détection automatique des signaux positifs de l’implication durable dans les conversations de consommateurs en parfumerie https://ertim.inalco.fr/node/598 <span class="field field--name-title field--type-string field--label-hidden">Détection automatique des signaux positifs de l’implication durable dans les conversations de consommateurs en parfumerie</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2017</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La fouille d’opinions est un sujet exploité en TAL depuis longtemps. Néanmoins, au cours des dernières années, une simple détection d’opinion positive ou négative ne satisfait plus les chercheurs et les entreprises. Le monde des affaires est à la re- cherche d’un «aperçu des affaires». Beaucoup d’algorithmes d’apprentissage peuvent être utilisés pour traiter le problème. Cependant, leur performance en face de don- nées déséquilibrées, souvent rencontrées dans l’industrie, est dégradée en raison des caractéristiques complexes inhérentes de ce type de corpus. Notre travail se concentre sur l’étude des techniques visant à traiter la classification asymétrique afin de réali- ser notre projet en fouille d’opinions. Cinq méthodes ont été comparées : Smote, Ada- syn, Tomek links, Smote-TL et modification du poids de la classe. Notre algorithme conventionnel choisi est SVM et l’évaluation est réalisée par le calcul des scores de précision, de rappel, de f-mesure et du temps d’exécution. Le classifieur LSTM a aussi été testé comme expérience complémentaire. Selon les résultats expérimentaux, la méthode en ajustant le poids sur le coût, qui nous permet d’obtenir notre meilleur F- mesure 67.82% avec le moins de temps d’exécution, obtient la meilleure performance.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2420" hreflang="fr">fouille d’opinions</a></div> <div class="field__item"><a href="/taxonomy/term/2421" hreflang="fr">classification asymétrique</a></div> <div class="field__item"><a href="/taxonomy/term/2422" hreflang="fr">svm</a></div> <div class="field__item"><a href="/taxonomy/term/2423" hreflang="fr">ré-échantillonnage</a></div> <div class="field__item"><a href="/taxonomy/term/2424" hreflang="fr">apprentissage sensible aux coûts</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/wangyizhe.pdf" type="application/pdf">wangyizhe.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 598 at https://ertim.inalco.fr