acquisition de connaissances https://ertim.inalco.fr/ fr Acquisition de connaissances à des fins d'analyse automatique : Extraction des différentes façons de nommer les ingrédients et actifs cosmétiques dans les conversations spontanées des internautes en français et anglais et comparaison multilingue https://ertim.inalco.fr/node/615 <span class="field field--name-title field--type-string field--label-hidden">Acquisition de connaissances à des fins d&#039;analyse automatique : Extraction des différentes façons de nommer les ingrédients et actifs cosmétiques dans les conversations spontanées des internautes en français et anglais et comparaison multilingue</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Karolina Krygier</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2018</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L&#039;objectif de ce mémoire est de mettre en place une méthode qui permette d&#039;extraire les différents nommages d&#039;ingrédients et actifs cosmétiques à partir de commentaires postés sur le Web en français et en anglais. Les commentaires n&#039;étant pas normalisés, les diverses expressions qui s&#039;y trouvent, amènent à s&#039;intéresser à leurs variations graphiques et morphosyntaxiques. La méthode exposée est hybride, alliant patrons morphosyntaxiques et distance de Levenshtein. Employée dans un contexte d&#039;acquisition de connaissances, les candidats termes validés pourront être intégrés aux ressources linguistiques et réutilisés dans des analyses ultérieures.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1904" hreflang="fr">acquisition de connaissances</a></div> <div class="field__item"><a href="/taxonomy/term/865" hreflang="fr">extraction terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2477" hreflang="fr">variation terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2428" hreflang="fr">méthode hybride</a></div> <div class="field__item"><a href="/taxonomy/term/2462" hreflang="fr">patrons morphosyntaxiques</a></div> <div class="field__item"><a href="/taxonomy/term/2409" hreflang="fr">distance de levenshtein</a></div> <div class="field__item"><a href="/taxonomy/term/2034" hreflang="fr">corpus multilingue</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoire_Krygier.pdf" type="application/pdf">memoire_Krygier.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 615 at https://ertim.inalco.fr Elaboration d’un outil d’enrichissement de terminologie pour un extracteur d’information https://ertim.inalco.fr/node/155 <span class="field field--name-title field--type-string field--label-hidden">Elaboration d’un outil d’enrichissement de terminologie pour un extracteur d’information</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2003</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce projet vise à améliorer le processus d’acquisition de terminologie du système d’Extraction d’Information de TEMIS, Insight Discoverer Extractor (IDE). Un système d’extraction d’information analyse des textes libres afin d’extraire l’information se rapportant à des types d’évènements, d’entités ou de relations pré-déterminés. Le portefeuille de Temis, société spécialisée en « Text Intelligence », comprend des applications d’extraction d’information spécialisées en Intelligence Economique (CI) et en analyse de relations clients (Customer Relationship Management (CRM)) pour des domaines de l’industrie qui couvrent aussi bien l’automobile, l’énergie, les pharmaceutiques, la médecine ou les médias. Pour la maintenance et l’amélioration de ces applications et afin d’accéder à de nouveaux domaines, il est nécessaire d’acquérir rapidement une nouvelle terminologie et de mettre à jour les applications existantes. Ce besoin a permis de déterminer les tâches du projet. La partie du projet liée à la recherche porte sur des méthodes de fouille de textes portant sur des domaines spécifiques pour la constitution de terminologie. La partie du projet liée à l’application elle-même offre une vision du processus d’extraction d’information de TEMIS, processus fondé sur la technologie des transducteurs à états finis. Nous décrivons plus particulièrement l’intégration de ressources lexicales acquises à partir de bases de lexique et de règles déjà existantes (TEMIS possède un format propriétaire appelé Skill Cartridges) qui sont utilisées par l’IDE. L’intégration des nouvelles ressources a été implémentée avec un outil d’import (LexTool). Nous décrivons enfin l’implémentation de l’outil, ainsi que son cadre d’expérimentation. </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/865" hreflang="fr">extraction terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2093" hreflang="fr">recherche d&#039;informations</a></div> <div class="field__item"><a href="/taxonomy/term/2094" hreflang="fr">veille technologique</a></div> <div class="field__item"><a href="/taxonomy/term/2095" hreflang="fr">fouille textuelle</a></div> <div class="field__item"><a href="/taxonomy/term/1904" hreflang="fr">acquisition de connaissances</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 155 at https://ertim.inalco.fr Extraction et structuration de connaissances issues de Wikipedia pour la construction d'une ontologie des êtres humains https://ertim.inalco.fr/node/109 <span class="field field--name-title field--type-string field--label-hidden">Extraction et structuration de connaissances issues de Wikipedia pour la construction d&#039;une ontologie des êtres humains</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Derazey</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2007</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire a pour objectif la conception d&#039;un outil d&#039;aide à la construction d&#039;une ontologie des entités nommées (EN) pour une application en désambiguïsation sémantique.<br /> <br /> C&#039;est un outil qui s&#039;appuie sur les données structurées de Wikipedia, ayant pour fonction d&#039;extraire des faits (entités et relations entre ces entités), de les injecter dans une base de données pour permettre de les interroger, et enfin de proposer des étiquettes à adjoindre aux entités qui aideront à les conceptualiser.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1902" hreflang="fr">extraction de données</a></div> <div class="field__item"><a href="/taxonomy/term/1756" hreflang="fr">base de connaissances</a></div> <div class="field__item"><a href="/taxonomy/term/1903" hreflang="fr">modélisation</a></div> <div class="field__item"><a href="/taxonomy/term/1904" hreflang="fr">acquisition de connaissances</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 109 at https://ertim.inalco.fr