allemand https://ertim.inalco.fr/ fr Recherche de termes équivalents à partir de corpus trilingues : constitution d'une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération https://ertim.inalco.fr/node/188 <span class="field field--name-title field--type-string field--label-hidden">Recherche de termes équivalents à partir de corpus trilingues : constitution d&#039;une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Les présentes recherches visent à constituer une terminologie multilingue dans le cadre du projet SAFIR (Système d&#039;Agents pour le Filtrage de l&#039;Information sur les Réseaux) concernant la recherche d&#039;information (en français, anglais et allemand) dans le domaine de la cogénération. A partir de listes terminologiques indépendantes, construites à l&#039;aide d&#039;outils d&#039;extraction de terminologie (LEXTER, XELDA), nous essayons de reconnaître les équivalents français,anglais et allemands dans des textes parallèles alignés. Nous comparons les résultats de l&#039;outil &#039;Twente&#039;, qui aligne des textes au niveau des mots, et d&#039;un outil développé par nos soins (&#039;MagicTermFinder&#039;). Les analyses nous montrent que le travail à effectuer se situe surtout au niveau de la préparation et de l&#039;application des termes. Dans une perspective plus lointaine, cette mise en relation terminologique devra être adaptée à des corpus comparables</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1873" hreflang="fr">terminologie</a></div> <div class="field__item"><a href="/taxonomy/term/2207" hreflang="fr">cogénération</a></div> <div class="field__item"><a href="/taxonomy/term/2115" hreflang="fr">multilingue</a></div> <div class="field__item"><a href="/taxonomy/term/2013" hreflang="fr">français</a></div> <div class="field__item"><a href="/taxonomy/term/1936" hreflang="fr">allemand</a></div> <div class="field__item"><a href="/taxonomy/term/2150" hreflang="fr">anglais</a></div> <div class="field__item"><a href="/taxonomy/term/1843" hreflang="fr">corpus</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2208" hreflang="fr">SAFIR</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 188 at https://ertim.inalco.fr Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation https://ertim.inalco.fr/node/140 <span class="field field--name-title field--type-string field--label-hidden">Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Puisque les chercheurs se concentrent plus sur les corpus bilingues, nous nous intéressons dans un premier temps à la situation des outils de traitement des corpus multilingues (plus de trois langues), y compris les langues slaves. Les outils pris en compte concernent l&#039;alignement et l&#039;extraction des termes, mais nous nous intéressons aussi aux concordanciers. Dans un second temps, nous appliquons les outils accessibles à notre corpus pour observer les occurrences extraites du corpus dans leur contexte immédiat et ensuite, l&#039;alignement effectué pour analyser des équivalences en traductions. A l’avenir, le traitement de ce corpus pourrait aboutir à un lexique quadrilingue spécialisé en programmation.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2034" hreflang="fr">corpus multilingue</a></div> <div class="field__item"><a href="/taxonomy/term/1837" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2035" hreflang="fr">concordanciers</a></div> <div class="field__item"><a href="/taxonomy/term/1778" hreflang="fr">extraction de termes</a></div> <div class="field__item"><a href="/taxonomy/term/1936" hreflang="fr">allemand</a></div> <div class="field__item"><a href="/taxonomy/term/2036" hreflang="fr">polonais</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 140 at https://ertim.inalco.fr Extraction d'entités nommées en allemand : impact des spécificités linguistiques https://ertim.inalco.fr/node/117 <span class="field field--name-title field--type-string field--label-hidden">Extraction d&#039;entités nommées en allemand : impact des spécificités linguistiques</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Brizard</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2008</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Les entités nommées correspondent traditionnellement à tous les noms propres présents dans un texte, soit les noms de personnes, de lieux et d’organisations ainsi que d’autres syntagmes tels que les dates ou les expressions numériques (pourcentages, sommes d’argent, etc.).<br /> <br /> L’extraction d’entités nommées est souvent évoquée en relation avec l’extraction d’information dont elle est par ailleurs issue. Cependant, bien d’autres applications en linguistique computationnelle peuvent faire usage des entités nommées en tant qu’elles constituent des indicateurs fondamentaux pour un accès pertinent au contenu des textes : moteurs de recherche, systèmes de questions-réponses, traduction automatique, entre autres.<br /> <br /> Ce mémoire a pour but d’étudier les problématiques liées à l’extraction d’entités nommées, notamment en langue allemande.<br /> <br /> A ce titre, nous proposons dans les Chapitres I et II un état des lieux sur le statut théorique des entités nommées et un état de l’art sur l’extraction d’entités nommées. Le Chapitre III introduit les problématiques liées à l’allemand au travers des propriétés linguistiques de cette langue, propriétés dont nous nous attachons à démontrer l’impact sur l’extraction d’entités nommées dans le Chapitre IV. Enfin, dans le Chapitre V, nous présentons la mise en œuvre dans la pratique de ressources linguistiques pour l’extraction d’entités nommées en allemand.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1935" hreflang="fr">extraction d&#039;entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/1936" hreflang="fr">allemand</a></div> <div class="field__item"><a href="/taxonomy/term/1937" hreflang="fr">impact des propriétés linguistiques</a></div> <div class="field__item"><a href="/taxonomy/term/1915" hreflang="fr">extraction d&#039;information</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 117 at https://ertim.inalco.fr