corpus comparables https://ertim.inalco.fr/ fr Extraction terminologique à partir de corpus spécialisés comparable collectés sur le web: construction d'un lexique de termes économiques trilingue https://ertim.inalco.fr/node/630 <span class="field field--name-title field--type-string field--label-hidden">Extraction terminologique à partir de corpus spécialisés comparable collectés sur le web: construction d&#039;un lexique de termes économiques trilingue</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Yamina Mir</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2019</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L’objectif de ce mémoire est de mettre en place une méthode qui permette d’extraire la terminologie à partir de corpus spécialisés comparables collectés sur la toile en italien, anglais et français. Les candidats-Terme extraits et validés, pourront ensuite être exploités pour la création d’un glossaire du domaine économique trilingue. Les listes de termes seront constituées en utilisant une méthode à la fois linguistique et statistique. L’extraction terminologique sera effectuée dans un premier temps à l’aide des N-grams constitués en utilisant l’outil TreeTagger. Ensuite, j’évaluerai le logiciel d’extraction terminologique TermoStat en m’appuyant sur le glossaire de référence créé au préalable. Le but est d’évaluer ces outils afin de déterminer s’ils peuvent être utilisés par un traducteur ou interprète dans la phase préparatoire des documents.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2536" hreflang="fr">extraction termiologique</a></div> <div class="field__item"><a href="/taxonomy/term/1782" hreflang="fr">corpus comparables</a></div> <div class="field__item"><a href="/taxonomy/term/2537" hreflang="fr">termostat</a></div> <div class="field__item"><a href="/taxonomy/term/2029" hreflang="fr">glossaire</a></div> <div class="field__item"><a href="/taxonomy/term/2538" hreflang="fr">n-grams</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 630 at https://ertim.inalco.fr Génération de frises narratives en utilisant des données alignées depuis des corpus comparables monolingues https://ertim.inalco.fr/node/589 <span class="field field--name-title field--type-string field--label-hidden">Génération de frises narratives en utilisant des données alignées depuis des corpus comparables monolingues</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2016</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le but de cette étude est de créer une représentation visuelle, sous la forme de frise narrative, des épisodes de la première saison de Game of Thrones (Le trône de fer). Ce type de représentation permet de clarifier les interactions entre les personnages et la chronologie des événements dans une fiction au récit particulièrement complexe. Pour réaliser cette tâche, nous utilisons différentes méthodes d’alignement et d’extraction sur des corpus comparables liés à Game of Thrones. Au fur et à mesure, nous retenons les résultats les plus pertinents pour améliorer notre frise. La frise finale contient les personnages alignés par scènes (qu’ils aient des dialogues ou non), les informations de lieu pour les situer, et des listes de termes caractéristiques qui décrivent les personnages et concepts clé de chaque épisode. .</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2384" hreflang="fr">alignement des corpus</a></div> <div class="field__item"><a href="/taxonomy/term/1950" hreflang="fr">extraction d’information</a></div> <div class="field__item"><a href="/taxonomy/term/1782" hreflang="fr">corpus comparables</a></div> <div class="field__item"><a href="/taxonomy/term/2385" hreflang="fr">frise narrative</a></div> <div class="field__item"><a href="/taxonomy/term/2386" hreflang="fr">dynamic time warping</a></div> <div class="field__item"><a href="/taxonomy/term/2387" hreflang="fr">game of thrones</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/masters_thesis_genevieve_bienvenue.pdf" type="application/pdf">masters_thesis_genevieve_bienvenue.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 589 at https://ertim.inalco.fr Le Projet Pertomed. Création d'une terminologie français/russe dans le domaine de la pharmacovigilance à partir de corpus comparables https://ertim.inalco.fr/node/135 <span class="field field--name-title field--type-string field--label-hidden">Le Projet Pertomed. Création d&#039;une terminologie français/russe dans le domaine de la pharmacovigilance à partir de corpus comparables</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Nous avons élaboré une terminologie bilingue français / russe susceptible de faciliter l&#039;automatisation des traductions dans le domaine de la pharmacovigilance – qui relève du domaine biomédical et pharmacologique –, mais aussi l’uniformisation du codage de l’information biomédicale en russe, qui reste pour l’instant très hétérogène compte tenu du manque de données spécifiques à cette langue dans les grandes bases de données internationales. En partant d’un corpus déjà défini en français, composé principalement des Résumés des Caractéristiques du Produit, nous avons constitué un corpus comparable pour le russe de 14 000 mots. Les résultats se présentent sous la forme d’un tableau où figurent en version bilingue 485 mots-vedettes, tous des substantifs, les syntagmes nominaux où ceux-ci apparaissent en tête ou en expansion, ainsi que les références permettant de rattacher ces termes aux sous-domaines auxquels ils appartiennent.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2016" hreflang="fr">linguistique de corpus</a></div> <div class="field__item"><a href="/taxonomy/term/2017" hreflang="fr">linguistique textuelle</a></div> <div class="field__item"><a href="/taxonomy/term/1782" hreflang="fr">corpus comparables</a></div> <div class="field__item"><a href="/taxonomy/term/2018" hreflang="fr">lexique bilingue français / russe</a></div> <div class="field__item"><a href="/taxonomy/term/2019" hreflang="fr">pharmacovigilance</a></div> <div class="field__item"><a href="/taxonomy/term/1766" hreflang="fr">terminologie médicale</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 135 at https://ertim.inalco.fr Exploitation de critéres de distinction automatique des textes scientifiques et vulgarisés autour des notions "diabéte / régime alimentaire" https://ertim.inalco.fr/node/80 <span class="field field--name-title field--type-string field--label-hidden">Exploitation de critéres de distinction automatique des textes scientifiques et vulgarisés autour des notions &quot;diabéte / régime alimentaire&quot;</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Tomimitsu</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Aprés avoir constitué deux corpus japonais (scientifique et vulgarisé) dans le cadre du projet DECO, diverses analyses ont été effectuées sur ces corpus pour en dégager des critéres de la distinction automatique des textes scientifiques et vulgarisés.<br /> <br /> Des critéres proposés par des études précédentes comme quelques critéres originaux (dont celui de la mise en rapport des styles &quot;neutre / poli&quot; avec les catégories &quot;scientifique / vulgarisé&quot;) ont été examinés et exploités.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1782" hreflang="fr">corpus comparables</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/1784" hreflang="fr">distinction automatique</a></div> <div class="field__item"><a href="/taxonomy/term/1785" hreflang="fr">genres discursifs</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 80 at https://ertim.inalco.fr