clustering https://ertim.inalco.fr/ fr Automatic detection of key events from daily news based on recurrent information analysis https://ertim.inalco.fr/node/599 <span class="field field--name-title field--type-string field--label-hidden">Automatic detection of key events from daily news based on recurrent information analysis</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2017</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Cette étude consiste à détecter les événements majeurs et les documents correspondants dans la presse quotidienne. Notre approche est basée sur l’hypothèse que si deux documents partagent des phrases décrivant les mêmes faits, ils sont susceptibles de faire référence au même événement. Ainsi, nous déterminons la proximité entre les documents en comparant la similarité textuelle au niveau des phrases. Les résultats indiquent que cette approche est efficace pour détecter les &quot;micro&quot; événements.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2425" hreflang="fr">détection de faits d’actualité</a></div> <div class="field__item"><a href="/taxonomy/term/2426" hreflang="fr">détection des événement</a></div> <div class="field__item"><a href="/taxonomy/term/2427" hreflang="fr">similarité entre phrases</a></div> <div class="field__item"><a href="/taxonomy/term/2335" hreflang="fr">clustering</a></div> <div class="field__item"><a href="/taxonomy/term/2088" hreflang="fr">fouille de textes</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/Xianfan%20ZHANG.pdf" type="application/pdf">Xianfan ZHANG.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 599 at https://ertim.inalco.fr L’intégration du thésaurus dans le traitement de la catégorisation automatique https://ertim.inalco.fr/node/574 <span class="field field--name-title field--type-string field--label-hidden">L’intégration du thésaurus dans le traitement de la catégorisation automatique</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2014</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire étudie le projet « catégorisation automatique » sur la plateforme LEOnard du département Etudes économiques de BNP Paribas. Ainsi il étudie le schéma du site LEOnard afin de comprendre les caractéristiques du corpus à catégoriser et afin de trouver la meilleure stratégie. Cependant, la richesse et la variété d’information rendent la catégorisation automatique plus complexe. Après avoir examiné l’approche de l’apprentissage automatique, nous nous rendons compte que cette approche n’est plus suffisante. Nous avons introduit le thésaurus dans la chaîne de traitement afin d’affiner l’extraction de termes dans le corpus. En calculant le score de termes dans le thésaurus, nous avons réussi à obtenir un résultat très satisfaisant.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2334" hreflang="fr">machine learning</a></div> <div class="field__item"><a href="/taxonomy/term/2335" hreflang="fr">clustering</a></div> <div class="field__item"><a href="/taxonomy/term/2336" hreflang="fr">catégorisation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2337" hreflang="fr">thésaurus</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/Yingying%20MA-Memoire%20du%20Master%202.pdf" type="application/pdf">Yingying MA-Memoire du Master 2.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 574 at https://ertim.inalco.fr