anglais https://ertim.inalco.fr/ fr Recherche de termes équivalents à partir de corpus trilingues : constitution d'une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération https://ertim.inalco.fr/node/188 <span class="field field--name-title field--type-string field--label-hidden">Recherche de termes équivalents à partir de corpus trilingues : constitution d&#039;une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Les présentes recherches visent à constituer une terminologie multilingue dans le cadre du projet SAFIR (Système d&#039;Agents pour le Filtrage de l&#039;Information sur les Réseaux) concernant la recherche d&#039;information (en français, anglais et allemand) dans le domaine de la cogénération. A partir de listes terminologiques indépendantes, construites à l&#039;aide d&#039;outils d&#039;extraction de terminologie (LEXTER, XELDA), nous essayons de reconnaître les équivalents français,anglais et allemands dans des textes parallèles alignés. Nous comparons les résultats de l&#039;outil &#039;Twente&#039;, qui aligne des textes au niveau des mots, et d&#039;un outil développé par nos soins (&#039;MagicTermFinder&#039;). Les analyses nous montrent que le travail à effectuer se situe surtout au niveau de la préparation et de l&#039;application des termes. Dans une perspective plus lointaine, cette mise en relation terminologique devra être adaptée à des corpus comparables</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1873" hreflang="fr">terminologie</a></div> <div class="field__item"><a href="/taxonomy/term/2207" hreflang="fr">cogénération</a></div> <div class="field__item"><a href="/taxonomy/term/2115" hreflang="fr">multilingue</a></div> <div class="field__item"><a href="/taxonomy/term/2013" hreflang="fr">français</a></div> <div class="field__item"><a href="/taxonomy/term/1936" hreflang="fr">allemand</a></div> <div class="field__item"><a href="/taxonomy/term/2150" hreflang="fr">anglais</a></div> <div class="field__item"><a href="/taxonomy/term/1843" hreflang="fr">corpus</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2208" hreflang="fr">SAFIR</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 188 at https://ertim.inalco.fr Identification des entités nommées dans un corpus français-anglais-arabe https://ertim.inalco.fr/node/167 <span class="field field--name-title field--type-string field--label-hidden">Identification des entités nommées dans un corpus français-anglais-arabe</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Avec la montée en puissance des réseaux (Internet notamment), la taille des documents multilingues à traiter devient de plus en plus importante, ce qui augmente les besoins en outils de traitement automatique pour différentes langues. Parmi ces outils, beaucoup ont recours à la reconnaissance et l&#039;extraction automatique des entités nommées : indexation automatique de documents, recherche d&#039;information, traduction automatique, catégorisation, etc. Notre travail de stage consiste à repérer les entités nommées dans un corpus trilingue Anglais/Arabe/Français (non aligné) collecté à partir des ressources disponibles sur Internet. Dans notre mémoire, nous commencerons d&#039;abord par la présentation d&#039;un état de l&#039;art pour passer en revue les récents systèmes développés pour la reconnaissance des entités nommées pour le Français et l&#039;Anglais ayant notamment participé aux conférences MUC. Nous tenterons ensuite d&#039;examiner ce qui a été fait pour le traitement automatique de l&#039;Arabe et, si possible, ceux concernant l&#039;extraction des entités nommées. Nous ferons ensuite le lien avec le travail réalisé durant notre stage et aborderons les difficultés rencontrées et les solutions mises en place pour les résoudre. </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/2149" hreflang="fr">reconnaissance automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2150" hreflang="fr">anglais</a></div> <div class="field__item"><a href="/taxonomy/term/2113" hreflang="fr">arabe</a></div> <div class="field__item"><a href="/taxonomy/term/2013" hreflang="fr">français</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 167 at https://ertim.inalco.fr