corpus parallèle https://ertim.inalco.fr/ fr La lexicographie bilingue en traduction automatique d’une langue peu dotée : une chaîne opératoire pour l’amharique https://ertim.inalco.fr/node/735 <span class="field field--name-title field--type-string field--label-hidden">La lexicographie bilingue en traduction automatique d’une langue peu dotée : une chaîne opératoire pour l’amharique</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">lun 09/10/2023 - 16:44</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Malik MARMONIER</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2022</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La traduction automatique, en tant que champ de recherche scientifique et de développement technique, témoignait – au tournant des années 2020 – d’un intérêt croissant pour les applications de son objet d’étude aux langues dites &quot;peu dotées&quot;, langues pour lesquelles les données nécessaires au développement de systèmes de traduction automatique neuronaux n’existent qu’en quantités infimes, les approches communément employées pour pallier ce déficit consistant à tenter d’obtenir ces données depuis le Web où les langues peu dotées souffrent pourtant d’un défaut notable de représentation. La présente étude s’est proposé d’extraire les données nécessaires à la compilation d’un corpus parallèle au départ de ressources alternatives – les seules images des pages de documents relevant de la lexicographie bilingue – et d’étudier, en les comparant, l’impact de telles données sur les performances de systèmes de traduction automatique, à la faveur d’une suite d’expériences appliquées à la paire de langue amharique-anglais.<br /> </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/875" hreflang="fr">traduction automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2607" hreflang="fr">langue peu dotée</a></div> <div class="field__item"><a href="/taxonomy/term/2266" hreflang="fr">lexicographie bilingue</a></div> <div class="field__item"><a href="/taxonomy/term/1764" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/2608" hreflang="fr">amharique</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/MARMONIER_Malik.pdf" type="application/pdf">MARMONIER_Malik.pdf</a></span> </div> </div> Mon, 09 Oct 2023 14:44:47 +0000 gestionnaire 735 at https://ertim.inalco.fr Evaluation d'un nouveau logiciel d'aide à la traduction par le biais de la création d'un glossaire juridique trilingue https://ertim.inalco.fr/node/87 <span class="field field--name-title field--type-string field--label-hidden">Evaluation d&#039;un nouveau logiciel d&#039;aide à la traduction par le biais de la création d&#039;un glossaire juridique trilingue</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Lenting</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L&#039;étude porte sur l&#039;évaluation d&#039;un nouveau logiciel de TAO en vue de la création d&#039;un glossaire juridique trilingue français-anglais-néerlandais.<br /> <br /> Les diverses fonctions du logiciel sont analysées dont notamment l&#039;extraction de terminologie à partir de corpus paralléles.<br /> <br /> Dans un second temps sera évoquée la problématique de la constitution d&#039;une terminologie juridique trilingue : la linguistique juridique, la constitution de corpus, le filtrage de la terminologie extraite et la concordance entre les différentes langues.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1814" hreflang="fr">TAO</a></div> <div class="field__item"><a href="/taxonomy/term/1764" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1815" hreflang="fr">extraction de terminologie</a></div> <div class="field__item"><a href="/taxonomy/term/1816" hreflang="fr">jurilinguistique</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 87 at https://ertim.inalco.fr Alignement de mots dans un corpus parallèle pour l'enrichissement de la terminologie médicale https://ertim.inalco.fr/node/76 <span class="field field--name-title field--type-string field--label-hidden">Alignement de mots dans un corpus parallèle pour l&#039;enrichissement de la terminologie médicale</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Deleger</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire présente une méthode pour repérer des termes médicaux dans un corpus parallèle français-anglais par alignement de mots.<br /> <br /> Nous avons deux objectifs: la détection de nouveaux termes médicaux français et la création d&#039;une liste de termes médicaux bilingue.<br /> <br /> Aprés avoir exposé nos objectifs et le contexte dans lequel ils s&#039;inscrivent, nous procédons à un état de l&#039;art du domaine de l&#039;alignement puis à la description pratique de la méthode employée (alignement de phrases, alignement de mots puis sélection de termes médicaux).<br /> <br /> Nous évaluons les résultats obtenus, qui sont prometteurs (parmi les termes médicaux sélectionnés, nous calculons une précision de 48%) méme si sujets à amélioration.<br /> <br /> Nous tentons ensuite d&#039;appliquer notre méthode à un corpus français-hindi en introduisant une difficulté nouvelle, celle posée par une langue &quot;peu dotée&quot;.<br /> <br /> Nous terminons en discutant les résultats et en proposant des pistes d&#039;amélioration de la méthode.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1763" hreflang="fr">alignement de mots</a></div> <div class="field__item"><a href="/taxonomy/term/1764" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1765" hreflang="fr">terminologie bilingue</a></div> <div class="field__item"><a href="/taxonomy/term/1766" hreflang="fr">terminologie médicale</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 76 at https://ertim.inalco.fr