sélection de caractéristiques https://ertim.inalco.fr/ fr Étude sur l’apport de la sélection des caractéristiques dans la classification multi-classe des textes https://ertim.inalco.fr/node/590 <span class="field field--name-title field--type-string field--label-hidden">Étude sur l’apport de la sélection des caractéristiques dans la classification multi-classe des textes</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2016</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail porte sur l’étude de l’apport de la sélection de caractéristiques pour la classification multi-classe de textes. Quatre méthodes de sélection ont été comparées : la spécificité lexicale, le TF-IDF, l’information mutuelle, et la différence proportionnelle catégorique. Pour éviter l’effet du sur-apprentissage, la sélection des caractéristiques a été intégrée à la validation croisée pour chaque sous-échantillon d’apprentissage. L’évaluation est réalisée principalement par un algorithme Bayésien Naïf Multinomial, et des tests sur les Machines à Vecteurs de Support ont été menés pour étudier l’effet de la régularisation. Selon des résultats expérimentaux, la spécificité lexicale, qui a obtenu une micro-moyenne F-mesure de 72.14% avec une réduction de 57% de caractéristiques, est la méthode la plus performante. .</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2388" hreflang="fr">classification multi-classe des textes</a></div> <div class="field__item"><a href="/taxonomy/term/2389" hreflang="fr">sélection de caractéristiques</a></div> <div class="field__item"><a href="/taxonomy/term/2390" hreflang="fr">apprentissage supervisé</a></div> <div class="field__item"><a href="/taxonomy/term/2391" hreflang="fr">validation croisée</a></div> <div class="field__item"><a href="/taxonomy/term/2392" hreflang="fr">régularisation</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoire-masterTAL-Yuming-ZHAI.pdf" type="application/pdf">memoire-masterTAL-Yuming-ZHAI.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 590 at https://ertim.inalco.fr