alignement de mots https://ertim.inalco.fr/ fr Exploitation d’un corpus parallèle trilingue : le travail du Centre d’Ingénierie Hydraulique d’Edf en Chine https://ertim.inalco.fr/node/92 <span class="field field--name-title field--type-string field--label-hidden">Exploitation d’un corpus parallèle trilingue : le travail du Centre d’Ingénierie Hydraulique d’Edf en Chine</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Guiraud</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2006</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Nous présentons ici les différentes étapes du traitement d’un corpus parallèle multilingue issu de la pratique professionnelle d’ingénieurs en mission d’expertise en Chine.<br /> <br /> Nous étudions les particularités d’un corpus à la fois relativement hétérogène et rare, et cherchons des solutions aux problèmes posés par ces caractéristiques.Notre approche étant avant tout pratique, nous mettons en œuvre une chaîne de traitement permettant d’extraire de ces documents le plus de données exploitables possible, et cherchons à évaluer, lors de l’alignement du corpus jusqu’au niveau des mots et des caractères chinois, les impacts des choix faits durant les étapes de préparation du corpus</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1763" hreflang="fr">alignement de mots</a></div> <div class="field__item"><a href="/taxonomy/term/1818" hreflang="fr">chinois</a></div> <div class="field__item"><a href="/taxonomy/term/1837" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1838" hreflang="fr">extraction de textes</a></div> <div class="field__item"><a href="/taxonomy/term/1839" hreflang="fr">segmentation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 92 at https://ertim.inalco.fr Alignement de mots dans un corpus parallèle pour l'enrichissement de la terminologie médicale https://ertim.inalco.fr/node/76 <span class="field field--name-title field--type-string field--label-hidden">Alignement de mots dans un corpus parallèle pour l&#039;enrichissement de la terminologie médicale</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Deleger</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire présente une méthode pour repérer des termes médicaux dans un corpus parallèle français-anglais par alignement de mots.<br /> <br /> Nous avons deux objectifs: la détection de nouveaux termes médicaux français et la création d&#039;une liste de termes médicaux bilingue.<br /> <br /> Aprés avoir exposé nos objectifs et le contexte dans lequel ils s&#039;inscrivent, nous procédons à un état de l&#039;art du domaine de l&#039;alignement puis à la description pratique de la méthode employée (alignement de phrases, alignement de mots puis sélection de termes médicaux).<br /> <br /> Nous évaluons les résultats obtenus, qui sont prometteurs (parmi les termes médicaux sélectionnés, nous calculons une précision de 48%) méme si sujets à amélioration.<br /> <br /> Nous tentons ensuite d&#039;appliquer notre méthode à un corpus français-hindi en introduisant une difficulté nouvelle, celle posée par une langue &quot;peu dotée&quot;.<br /> <br /> Nous terminons en discutant les résultats et en proposant des pistes d&#039;amélioration de la méthode.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1763" hreflang="fr">alignement de mots</a></div> <div class="field__item"><a href="/taxonomy/term/1764" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1765" hreflang="fr">terminologie bilingue</a></div> <div class="field__item"><a href="/taxonomy/term/1766" hreflang="fr">terminologie médicale</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 76 at https://ertim.inalco.fr