alignement https://ertim.inalco.fr/ fr Recherche de termes équivalents à partir de corpus trilingues : constitution d'une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération https://ertim.inalco.fr/node/188 <span class="field field--name-title field--type-string field--label-hidden">Recherche de termes équivalents à partir de corpus trilingues : constitution d&#039;une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Les présentes recherches visent à constituer une terminologie multilingue dans le cadre du projet SAFIR (Système d&#039;Agents pour le Filtrage de l&#039;Information sur les Réseaux) concernant la recherche d&#039;information (en français, anglais et allemand) dans le domaine de la cogénération. A partir de listes terminologiques indépendantes, construites à l&#039;aide d&#039;outils d&#039;extraction de terminologie (LEXTER, XELDA), nous essayons de reconnaître les équivalents français,anglais et allemands dans des textes parallèles alignés. Nous comparons les résultats de l&#039;outil &#039;Twente&#039;, qui aligne des textes au niveau des mots, et d&#039;un outil développé par nos soins (&#039;MagicTermFinder&#039;). Les analyses nous montrent que le travail à effectuer se situe surtout au niveau de la préparation et de l&#039;application des termes. Dans une perspective plus lointaine, cette mise en relation terminologique devra être adaptée à des corpus comparables</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1873" hreflang="fr">terminologie</a></div> <div class="field__item"><a href="/taxonomy/term/2207" hreflang="fr">cogénération</a></div> <div class="field__item"><a href="/taxonomy/term/2115" hreflang="fr">multilingue</a></div> <div class="field__item"><a href="/taxonomy/term/2013" hreflang="fr">français</a></div> <div class="field__item"><a href="/taxonomy/term/1936" hreflang="fr">allemand</a></div> <div class="field__item"><a href="/taxonomy/term/2150" hreflang="fr">anglais</a></div> <div class="field__item"><a href="/taxonomy/term/1843" hreflang="fr">corpus</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2208" hreflang="fr">SAFIR</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 188 at https://ertim.inalco.fr Etude comparative de deux outils de TAO https://ertim.inalco.fr/node/162 <span class="field field--name-title field--type-string field--label-hidden">Etude comparative de deux outils de TAO</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2003</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le service de traduction du Parlement européen est une structure unique qui présente des caractéristiques très spécifiques. En effet, il faut gérer un très grand nombre de couples de langues et les documents sont d&#039;une diversité extrêmement grande. Les outils pour aider le traducteur dans sa tâche sont très nombreux et variés. C&#039;est la traduction assistée qui se prête le mieux aux besoins internes des traducteurs. L&#039;outil utilisé jusqu&#039;à présent était le TWB de la société Trados. Cependant, un autre programme a été mis au point en interne et il est actuellement en phase finale de test. Le travail de recherche que j&#039;ai effectué au sein de cette institution pendant mon stage consiste à confronter le TWB avec FUSE, le nouvel outil de traduction assistée mis au point par un informaticien interne. Dans mon étude je cherche à savoir pourquoi un outil généraliste tel que le TWB ne s&#039;est pas montré totalement efficace pour certains documents et a nécessité la création d&#039;un nouvel outil. S&#039;agit-il d&#039;une faille au niveau du programme lui-même (problème structurel) ou bien, est-ce dû au contexte dans lequel cet outil est utilisé (problème environnemental) ? A travers une étude comparative des performances de ces deux outils sur un type de document particulier j&#039;essaierai de montrer les aspects positifs et négatifs de chacun d&#039;eux.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1761" hreflang="fr">multilinguisme</a></div> <div class="field__item"><a href="/taxonomy/term/2123" hreflang="fr">mémoire de traduction</a></div> <div class="field__item"><a href="/taxonomy/term/1839" hreflang="fr">segmentation</a></div> <div class="field__item"><a href="/taxonomy/term/2138" hreflang="fr">granularité</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 162 at https://ertim.inalco.fr Constitution d’un corpus bilingue aligné français-persan https://ertim.inalco.fr/node/148 <span class="field field--name-title field--type-string field--label-hidden">Constitution d’un corpus bilingue aligné français-persan</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2003</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire présente une méthode d’alignement de corpus parallèles. Nous utiliserons un corpus journalistique bilingue français-persan constitué à partir des numéros d’avril à septembre 2003 du Monde diplomatique. La première phase consistera à aligner deux corpus, paragraphe par paragraphe. Ensuite, nous procéderons à une évaluation des problèmes rencontrés et nous proposerons des critères permettant d’améliorer les performances de cette méthode.<br /> <br /> Notre objectif est d’aligner deux langues de système graphique différent, en l’occurrence le persan et le français, et d’en présenter les limites et par la même occasion, les outils qui ont été utilisés pour mener à bien ce travail. Après une brève description de la structure du persan, nous tâcherons de décrire les différences morpho-syntaxiques par rapport au français. Et enfin, l’analyse des résultats de l’alignement permettra de mettre en lumière les difficultés et les complexités de notre démarche.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2072" hreflang="fr">corpus parallèles</a></div> <div class="field__item"><a href="/taxonomy/term/2073" hreflang="fr">bitextes</a></div> <div class="field__item"><a href="/taxonomy/term/2074" hreflang="fr">concordancier</a></div> <div class="field__item"><a href="/taxonomy/term/1761" hreflang="fr">multilinguisme</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 148 at https://ertim.inalco.fr Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation https://ertim.inalco.fr/node/140 <span class="field field--name-title field--type-string field--label-hidden">Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Puisque les chercheurs se concentrent plus sur les corpus bilingues, nous nous intéressons dans un premier temps à la situation des outils de traitement des corpus multilingues (plus de trois langues), y compris les langues slaves. Les outils pris en compte concernent l&#039;alignement et l&#039;extraction des termes, mais nous nous intéressons aussi aux concordanciers. Dans un second temps, nous appliquons les outils accessibles à notre corpus pour observer les occurrences extraites du corpus dans leur contexte immédiat et ensuite, l&#039;alignement effectué pour analyser des équivalences en traductions. A l’avenir, le traitement de ce corpus pourrait aboutir à un lexique quadrilingue spécialisé en programmation.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2034" hreflang="fr">corpus multilingue</a></div> <div class="field__item"><a href="/taxonomy/term/1837" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2035" hreflang="fr">concordanciers</a></div> <div class="field__item"><a href="/taxonomy/term/1778" hreflang="fr">extraction de termes</a></div> <div class="field__item"><a href="/taxonomy/term/1936" hreflang="fr">allemand</a></div> <div class="field__item"><a href="/taxonomy/term/2036" hreflang="fr">polonais</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 140 at https://ertim.inalco.fr Outils d'extraction et d'alignement terminologiques franco-japonais https://ertim.inalco.fr/node/134 <span class="field field--name-title field--type-string field--label-hidden">Outils d&#039;extraction et d&#039;alignement terminologiques franco-japonais</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire propose une méthode pour constituer des ressources lexicales type glossaire, lexique etc. bilingues japonais français. Dans ce but, un outil d’extraction terminologique pour le japonais, ACABIT, y sera présenté et testé. Sur la base des termes extraits à partir d’un corpus à l’origine bilingue et ensuite alignés, nous avons pu élaborer des unités de traduction qui peuvent servir de base à la construction de ressources lexicales bilingues. Ce mémoire apporte également une évaluation et une critique des outils et logiciels étudiés et de la méthode envisagée.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1820" hreflang="fr">extraction</a></div> <div class="field__item"><a href="/taxonomy/term/2011" hreflang="fr">candidats termes</a></div> <div class="field__item"><a href="/taxonomy/term/2012" hreflang="fr">ACABIT</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/2013" hreflang="fr">français</a></div> <div class="field__item"><a href="/taxonomy/term/2014" hreflang="fr">ressources lexicales</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2015" hreflang="fr">unités de traduction</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 134 at https://ertim.inalco.fr Etude du Present Perfect anglais à partir de corpus parallèles https://ertim.inalco.fr/node/123 <span class="field field--name-title field--type-string field--label-hidden">Etude du Present Perfect anglais à partir de corpus parallèles</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L’objectif de ce mémoire est d’étudier un phénomène linguistique qui s’appelle «The Present Perfect Puzzle » à travers l’analyse d’un corpus parallèle anglais – français de 15Mo.<br /> <br /> Pour illustrer ce phénomène, rappelons qu’à la différence du Passé composé français, le Present Perfect anglais ne peut pas apparaître avec les adverbes ponctuels. Un alignement de corpus dans les deux langues permettra d’étudier les cas précis de ce phénomène et de déterminer quels groupes d’adverbes peuvent apparaître avec ce temps dans chaque langue.<br /> <br /> A l’aide de programmes créés en langage « perl », j’ai normalisé le corpus et j’en ai extrait toutes les phrases contenant plus particulièrement des adverbes temporels, y compris les expressions adverbiales. Le résultat de l’extraction comprend désormais deux fichiers, un pour chaque langue. Les phrases extraites sont alignées dans une interface Access pour permettre l’analyse linguistique proprement dite.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1959" hreflang="fr">present perfect puzzle</a></div> <div class="field__item"><a href="/taxonomy/term/1837" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1960" hreflang="fr">syntaxe</a></div> <div class="field__item"><a href="/taxonomy/term/1919" hreflang="fr">sémantique</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/1961" hreflang="fr">expressions régulières</a></div> <div class="field__item"><a href="/taxonomy/term/1962" hreflang="fr">adverbes</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 123 at https://ertim.inalco.fr Extraction d’un lexique français-anglais relatif à la sécurité internationale à partir d’un corpus parallèle https://ertim.inalco.fr/node/107 <span class="field field--name-title field--type-string field--label-hidden">Extraction d’un lexique français-anglais relatif à la sécurité internationale à partir d’un corpus parallèle</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Pichon</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2007</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le propos de cette expérimentation est d’établir un lexique français – anglais à l’aide d’outils textométriques.<br /> <br /> Après une brève exploration des méthodes de textométrie pure dans une optique d’extraction terminologique, cette expérimentation portera plus particulièrement sur une approche hybride alliant textométrie et filtrage morphosyntaxique. Il sera alors procédé à un étiquetage morphosyntaxique du texte source afin d’effectuer sur celui-ci une extraction de syntagmes français selon des patrons morpho-syntaxiques choisis.<br /> <br /> Des termes relevant du domaine de la sécurité internationale seront ensuite sélectionnés parmi ces instances de patrons français puis leurs équivalents traductionnels seront recherchés dans le texte cible anglais, préalablement aligné au texte source français.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1894" hreflang="fr">extraction de candidats termes</a></div> <div class="field__item"><a href="/taxonomy/term/1837" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/1845" hreflang="fr">textométrie</a></div> <div class="field__item"><a href="/taxonomy/term/1896" hreflang="fr">filtrage à l’aide de patrons morpho-syntaxiques</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 107 at https://ertim.inalco.fr