topic modelling https://ertim.inalco.fr/ fr Comparaison de Topic Models pour l'extraction de lexique et la classification de courts textes https://ertim.inalco.fr/node/732 <span class="field field--name-title field--type-string field--label-hidden">Comparaison de Topic Models pour l&#039;extraction de lexique et la classification de courts textes</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">lun 09/10/2023 - 16:33</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Arthur BOUZARD</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2022</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Cette étude fait suite à celles des précédents stagiaires du Français des affaires, qui s&#039;articule autour de la construction d&#039;un système de notation automatique de copies de Test d&#039;Evaluation de Français, un examen à forts enjeux permettant l&#039;obtention du droit de résidence ou de naturalisation en France ou au Canada. Ce système se basant sur des caractéristiques extraites des copies de l&#039;examen, nous nous penchons sur l&#039;automatisation de l&#039;extraction d&#039;une caractéristique qui était produite en partie manuellement. Cette dernière se repose sur la confection manuelle laborieuse de lexiques thématiques. De nombreuses études utilisent le topic modelling pour l&#039;alignement de lexiques bilingues voire même l&#039;extraction de lexiques par niveau de langue, nous nous attarderons ici sur cette technique afin d&#039;entretenir le système de notation automatique. </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/en/taxonomy/term/2586" hreflang="en">français langue étrangère</a></div> <div class="field__item"><a href="/taxonomy/term/2364" hreflang="fr">apprentissage automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2417" hreflang="fr">topic modelling</a></div> <div class="field__item"><a href="/taxonomy/term/2599" hreflang="fr">lexique thématique</a></div> <div class="field__item"><a href="/taxonomy/term/2445" hreflang="fr">plongements lexicaux</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/BOUZARD.pdf" type="application/pdf">BOUZARD.pdf</a></span> </div> </div> Mon, 09 Oct 2023 14:33:04 +0000 gestionnaire 732 at https://ertim.inalco.fr Apport du calcul de similarité et du topic modelling pour l'exploration de retours d'expérience dans le domaine de la sûreté de fonctionnement des lanceurs spatiaux https://ertim.inalco.fr/node/597 <span class="field field--name-title field--type-string field--label-hidden">Apport du calcul de similarité et du topic modelling pour l&#039;exploration de retours d&#039;expérience dans le domaine de la sûreté de fonctionnement des lanceurs spatiaux</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2017</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Dans le domaine de la sûreté de fonctionnement, le retour d’expérience consiste à décrire, analyser et archiver tous les incidents et anomalies survenus lors d’une procédure. La multiplicité des sources et moyens de retours d’expérience conduit à une production de plus en plus importante et hétérogènes de contenu peu ou pas structurés. Notre travail vise à mieux exploiter de tels documents dans le domaine du spatial (CNES) afin de faire émerger des thématiques principales, d&#039;identifier des tendances et, à terme, de repérer des signaux faibles liés aux incidents lors du lancement de fusées. Nous explorons dans ce mémoire différentes techniques de traitement automatique des langues pour venir en aide aux experts en sûreté de fonctionnement du CNES dans leur exploration des bases de données de retour d’expérience. En particulier, nous nous sommes intéressés au LDA afin de faire émerger des thématiques au sein du corpus et au TF-IDF et au LSA pour calculer des similarités entre les documents. Nous montrons les avantages qu’apportent ces techniques les unes par rapport aux autres. Un logiciel a été développé qui réalise ces calculs et propos des visualisations adaptées. De manière plus générale, ce travail montre l&#039;intérêt de traiter les documents issus de retour d&#039;expérience afin d&#039;améliorer le déroulement de processus industriels.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2415" hreflang="fr">sûreté de fonctionnement</a></div> <div class="field__item"><a href="/taxonomy/term/2416" hreflang="fr">calcul de similarité</a></div> <div class="field__item"><a href="/taxonomy/term/2417" hreflang="fr">topic modelling</a></div> <div class="field__item"><a href="/taxonomy/term/2418" hreflang="fr">analyse sémantique latente</a></div> <div class="field__item"><a href="/taxonomy/term/2419" hreflang="fr">allocation de dirichlet latente</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 597 at https://ertim.inalco.fr