Comparaison entre la méthode symbolique et la méthode par apprentissage dans l'efficacité de la détection thématique d'articles de presse

Anonyme — Thu, 05 Nov 2020 23:00:00 +0000

Comparaison entre la méthode symbolique et la méthode par apprentissage dans l'efficacité de la détection thématique d'articles de presse Anonyme (non vérifié) ven 06/11/2020 - 00:00

Auteur

Nicolas Scarcella

Année

2018

Résumé

Ce mémoire porte sur l’étude de la détection thématique d’articles de presse pour une recherche sur la néologie. L’objet du travail réside dans la confrontation de la méthode symbolique, appuyée sur des listes et un vocabulaire contrôlé, avec la méthode d’apprentissage automatique, basée sur des algorithmes et calculs mathématiques. Ces deux procédures offrent l’analyse binaire visant à doter la machine d’une intelligence artificielle capable de détecter correctement les sujets abordés dans un texte dans le but de localiser les contextes qui aideront, dans un projet de détection de néologismes, à s’approcher de leur sens sémantique. Dans un premier temps, le travail consiste en une réflexion sur le moteur de détection déjà existant puis, dans un second temps, en l’exploration de nouvelles techniques permettant d’optimiser la détection thématique.

Mots-clés

machine learning

clusterisation

classification

etiquetage

ngrams

matching

Fichier

Scarcella_memoireTAL-IM_2018.pdf

L’intégration du thésaurus dans le traitement de la catégorisation automatique

Anonyme — Thu, 05 Nov 2020 23:00:00 +0000

L’intégration du thésaurus dans le traitement de la catégorisation automatique Anonyme (non vérifié) ven 06/11/2020 - 00:00

Année

2014

Résumé

Ce mémoire étudie le projet « catégorisation automatique » sur la plateforme LEOnard du département Etudes économiques de BNP Paribas. Ainsi il étudie le schéma du site LEOnard afin de comprendre les caractéristiques du corpus à catégoriser et afin de trouver la meilleure stratégie. Cependant, la richesse et la variété d’information rendent la catégorisation automatique plus complexe. Après avoir examiné l’approche de l’apprentissage automatique, nous nous rendons compte que cette approche n’est plus suffisante. Nous avons introduit le thésaurus dans la chaîne de traitement afin d’affiner l’extraction de termes dans le corpus. En calculant le score de termes dans le thésaurus, nous avons réussi à obtenir un résultat très satisfaisant.

Mots-clés

machine learning

clustering

catégorisation automatique

thésaurus

Fichier

Yingying MA-Memoire du Master 2.pdf