apprentissage sensible aux coûts https://ertim.inalco.fr/ fr Détection automatique des signaux positifs de l’implication durable dans les conversations de consommateurs en parfumerie https://ertim.inalco.fr/node/598 <span class="field field--name-title field--type-string field--label-hidden">Détection automatique des signaux positifs de l’implication durable dans les conversations de consommateurs en parfumerie</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2017</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La fouille d’opinions est un sujet exploité en TAL depuis longtemps. Néanmoins, au cours des dernières années, une simple détection d’opinion positive ou négative ne satisfait plus les chercheurs et les entreprises. Le monde des affaires est à la re- cherche d’un «aperçu des affaires». Beaucoup d’algorithmes d’apprentissage peuvent être utilisés pour traiter le problème. Cependant, leur performance en face de don- nées déséquilibrées, souvent rencontrées dans l’industrie, est dégradée en raison des caractéristiques complexes inhérentes de ce type de corpus. Notre travail se concentre sur l’étude des techniques visant à traiter la classification asymétrique afin de réali- ser notre projet en fouille d’opinions. Cinq méthodes ont été comparées : Smote, Ada- syn, Tomek links, Smote-TL et modification du poids de la classe. Notre algorithme conventionnel choisi est SVM et l’évaluation est réalisée par le calcul des scores de précision, de rappel, de f-mesure et du temps d’exécution. Le classifieur LSTM a aussi été testé comme expérience complémentaire. Selon les résultats expérimentaux, la méthode en ajustant le poids sur le coût, qui nous permet d’obtenir notre meilleur F- mesure 67.82% avec le moins de temps d’exécution, obtient la meilleure performance.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2420" hreflang="fr">fouille d’opinions</a></div> <div class="field__item"><a href="/taxonomy/term/2421" hreflang="fr">classification asymétrique</a></div> <div class="field__item"><a href="/taxonomy/term/2422" hreflang="fr">svm</a></div> <div class="field__item"><a href="/taxonomy/term/2423" hreflang="fr">ré-échantillonnage</a></div> <div class="field__item"><a href="/taxonomy/term/2424" hreflang="fr">apprentissage sensible aux coûts</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/wangyizhe.pdf" type="application/pdf">wangyizhe.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 598 at https://ertim.inalco.fr