catégorisation automatique https://ertim.inalco.fr/ fr Apports de la catégorisation automatique à la veille collaborative https://ertim.inalco.fr/node/581 <span class="field field--name-title field--type-string field--label-hidden">Apports de la catégorisation automatique à la veille collaborative</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2015</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail aborde la question de l’utilisation de la fouille de texte dans le domaine de la veille, plus particulièrement la classification automatique de documents. Il s’agit de comparer différentes méthodes de catégorisation dépendant de problématiques linguistiques propres à chaque thématique traitée dans une plateforme de veille collaborative. Nous présenterons les résultats de trois méthodes de classification automatique, utilisant d’une part un modèle d’apprentissage et d’autre part des ressources linguistiques, à savoir l’utilisation d’une hiérarchie de concepts et d’un thésaurus.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1951" hreflang="fr">fouille de texte</a></div> <div class="field__item"><a href="/taxonomy/term/2336" hreflang="fr">catégorisation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2364" hreflang="fr">apprentissage automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2365" hreflang="fr">hiérarchie de concepts</a></div> <div class="field__item"><a href="/taxonomy/term/2337" hreflang="fr">thésaurus</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/m%C3%A9moire%20final%20Aur%C3%A9lie%20Jouannet.pdf" type="application/pdf">mémoire final Aurélie Jouannet.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 581 at https://ertim.inalco.fr L’intégration du thésaurus dans le traitement de la catégorisation automatique https://ertim.inalco.fr/node/574 <span class="field field--name-title field--type-string field--label-hidden">L’intégration du thésaurus dans le traitement de la catégorisation automatique</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2014</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire étudie le projet « catégorisation automatique » sur la plateforme LEOnard du département Etudes économiques de BNP Paribas. Ainsi il étudie le schéma du site LEOnard afin de comprendre les caractéristiques du corpus à catégoriser et afin de trouver la meilleure stratégie. Cependant, la richesse et la variété d’information rendent la catégorisation automatique plus complexe. Après avoir examiné l’approche de l’apprentissage automatique, nous nous rendons compte que cette approche n’est plus suffisante. Nous avons introduit le thésaurus dans la chaîne de traitement afin d’affiner l’extraction de termes dans le corpus. En calculant le score de termes dans le thésaurus, nous avons réussi à obtenir un résultat très satisfaisant.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2334" hreflang="fr">machine learning</a></div> <div class="field__item"><a href="/taxonomy/term/2335" hreflang="fr">clustering</a></div> <div class="field__item"><a href="/taxonomy/term/2336" hreflang="fr">catégorisation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2337" hreflang="fr">thésaurus</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/Yingying%20MA-Memoire%20du%20Master%202.pdf" type="application/pdf">Yingying MA-Memoire du Master 2.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 574 at https://ertim.inalco.fr