thésaurus https://ertim.inalco.fr/ fr Etude d'une méthode de sélection de documents macroéconomiques au sein d'un corpus d'articles de presse économique https://ertim.inalco.fr/node/595 <span class="field field--name-title field--type-string field--label-hidden">Etude d&#039;une méthode de sélection de documents macroéconomiques au sein d&#039;un corpus d&#039;articles de presse économique</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2016</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail porte sur la sélection d’articles macroéconomiques au sein d’un module de catégorisation destiné à classifier la presse macroéconomique. Ce module reçoit en entrée un flux de presse économique et doit permettre de catégoriser les documents dans quatre classes principales, sachant que certains documents n’appartiennent à aucune d’entre elles (les documents microéconomiques).</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2140" hreflang="fr">catégorisation de textes</a></div> <div class="field__item"><a href="/taxonomy/term/1951" hreflang="fr">fouille de texte</a></div> <div class="field__item"><a href="/taxonomy/term/2411" hreflang="fr">plan d’annotation</a></div> <div class="field__item"><a href="/taxonomy/term/2251" hreflang="fr">text mining</a></div> <div class="field__item"><a href="/taxonomy/term/2337" hreflang="fr">thésaurus</a></div> <div class="field__item"><a href="/taxonomy/term/2365" hreflang="fr">hiérarchie de concepts</a></div> <div class="field__item"><a href="/taxonomy/term/1825" hreflang="fr">ingénierie des connaissances</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 595 at https://ertim.inalco.fr Création semi-automatique d'un thésaurus du domaine bancaire et application à la fouille d'opinion https://ertim.inalco.fr/node/593 <span class="field field--name-title field--type-string field--label-hidden">Création semi-automatique d&#039;un thésaurus du domaine bancaire et application à la fouille d&#039;opinion</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2016</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La fouille d’opinion devient une approche de plus en plus intéressante pour les entreprises qui souhaitent évaluer la qualité de leurs produits auprès de leurs clients. Notre travail consiste à évaluer des relations, c’est-à-dire des opinions émises précisément sur des objets appelés cibles. Nous créons un thésaurus sur le domaine bancaire afin d’avoir des cibles prédéfinies. Nous nous basons sur un corpus composé d’avis clients récupérés sur internet. Nous abordons deux approches, une à base d’un module d’extraction déjà existant et une autre à base de règles que nous allons développer nous-mêmes. Nous ne pouvons présenter de résultats pour l’approche à base de règles pour cause d’incompatibilité des sorties des différents outils. Nous obtenons un rappel plus faible par rapport à l’état de l’art sur une problématique similaire avec l’approche utilisant le thésaurus. Mais nos résultats globaux sont supérieurs, avec une F-mesure de 70,1%.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2305" hreflang="fr">opinion mining</a></div> <div class="field__item"><a href="/taxonomy/term/2402" hreflang="fr">fouille d’opinion</a></div> <div class="field__item"><a href="/taxonomy/term/2337" hreflang="fr">thésaurus</a></div> <div class="field__item"><a href="/taxonomy/term/2403" hreflang="fr">banque</a></div> <div class="field__item"><a href="/taxonomy/term/2404" hreflang="fr">polarité</a></div> <div class="field__item"><a href="/taxonomy/term/2405" hreflang="fr">relations</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/VPoadey_Memoire_M2IM_1516_correction.pdf" type="application/pdf">VPoadey_Memoire_M2IM_1516_correction.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 593 at https://ertim.inalco.fr Apports de la catégorisation automatique à la veille collaborative https://ertim.inalco.fr/node/581 <span class="field field--name-title field--type-string field--label-hidden">Apports de la catégorisation automatique à la veille collaborative</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2015</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail aborde la question de l’utilisation de la fouille de texte dans le domaine de la veille, plus particulièrement la classification automatique de documents. Il s’agit de comparer différentes méthodes de catégorisation dépendant de problématiques linguistiques propres à chaque thématique traitée dans une plateforme de veille collaborative. Nous présenterons les résultats de trois méthodes de classification automatique, utilisant d’une part un modèle d’apprentissage et d’autre part des ressources linguistiques, à savoir l’utilisation d’une hiérarchie de concepts et d’un thésaurus.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1951" hreflang="fr">fouille de texte</a></div> <div class="field__item"><a href="/taxonomy/term/2336" hreflang="fr">catégorisation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2364" hreflang="fr">apprentissage automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2365" hreflang="fr">hiérarchie de concepts</a></div> <div class="field__item"><a href="/taxonomy/term/2337" hreflang="fr">thésaurus</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/m%C3%A9moire%20final%20Aur%C3%A9lie%20Jouannet.pdf" type="application/pdf">mémoire final Aurélie Jouannet.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 581 at https://ertim.inalco.fr L’intégration du thésaurus dans le traitement de la catégorisation automatique https://ertim.inalco.fr/node/574 <span class="field field--name-title field--type-string field--label-hidden">L’intégration du thésaurus dans le traitement de la catégorisation automatique</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2014</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire étudie le projet « catégorisation automatique » sur la plateforme LEOnard du département Etudes économiques de BNP Paribas. Ainsi il étudie le schéma du site LEOnard afin de comprendre les caractéristiques du corpus à catégoriser et afin de trouver la meilleure stratégie. Cependant, la richesse et la variété d’information rendent la catégorisation automatique plus complexe. Après avoir examiné l’approche de l’apprentissage automatique, nous nous rendons compte que cette approche n’est plus suffisante. Nous avons introduit le thésaurus dans la chaîne de traitement afin d’affiner l’extraction de termes dans le corpus. En calculant le score de termes dans le thésaurus, nous avons réussi à obtenir un résultat très satisfaisant.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2334" hreflang="fr">machine learning</a></div> <div class="field__item"><a href="/taxonomy/term/2335" hreflang="fr">clustering</a></div> <div class="field__item"><a href="/taxonomy/term/2336" hreflang="fr">catégorisation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2337" hreflang="fr">thésaurus</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/Yingying%20MA-Memoire%20du%20Master%202.pdf" type="application/pdf">Yingying MA-Memoire du Master 2.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 574 at https://ertim.inalco.fr