linguistique de corpus https://ertim.inalco.fr/ fr Terminologie d'entreprise : recherche de solutions pour la refonte de l'existant : proposition d'un outil de gestion de bases de données terminologiques https://ertim.inalco.fr/node/175 <span class="field field--name-title field--type-string field--label-hidden">Terminologie d&#039;entreprise : recherche de solutions pour la refonte de l&#039;existant : proposition d&#039;un outil de gestion de bases de données terminologiques</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Les besoins en terminologie deviennent de plus en plus importants dans les entreprises. En effet, de nombreuses données terminologiques multilingues coexistent sans pour autant être homogènes et normalisées. Dans ce mémoire, nous nous interrogeons donc sur la méthodologie à utiliser afin d&#039;obtenir une base de données terminologique structurée et de qualité. D&#039;autre part, nous posons la question de savoir comment procéder pour éviter la « pollution » de la future base ? Nous comparons trois solutions différentes : extraction terminologique à partir de corpus, tri des données, reprise de l&#039;existant. La première solution serait idéale. Cependant, dans quelle mesure est-il possible de changer les pratiques existantes au profit de la construction terminologique à partir des corpus textuels ? Plusieurs contraintes nous font pencher vers la deuxième solution à savoir tri et récupération d&#039;un fond terminologique en associant un code de fiabilité à chaque terme par exemple.<br /> <br /> Parallèlement à cette réflexion, nous proposons un modèle d&#039;un outil de gestion de bases de données terminologiques accessible via l&#039;Intranet. Il est nécessaire que cet outil tienne compte des évolution en matière d&#039;échanges de données terminologiques au format XML (MARTIF, GENETER etc.).</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1786" hreflang="fr">base de données terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2016" hreflang="fr">linguistique de corpus</a></div> <div class="field__item"><a href="/taxonomy/term/2175" hreflang="fr">formats d’échange de données terminologiques</a></div> <div class="field__item"><a href="/taxonomy/term/1989" hreflang="fr">XML</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 175 at https://ertim.inalco.fr Constituer une ressource terminologique : exemple des thesauri bilingues pour Thales https://ertim.inalco.fr/node/150 <span class="field field--name-title field--type-string field--label-hidden">Constituer une ressource terminologique : exemple des thesauri bilingues pour Thales</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2003</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire est l’objet d’une réflexion sur les méthodes de conception des ressources terminologiques, de la collecte du vocabulaire au codage des données au sein d’un réseau terminologique. Nous restituons un panorama non exhaustif de différents types de ressources terminologiques, c’est-à-dire leurs propriétés, leurs fonctions, leurs contextes d’application notamment pour les dictionnaires, lexiques, classifications ou thesauri. Nous présentons également quelques méthodes d’acquisition automatique de terminologie : par exemple, le repérage des segments répétés dans un corpus et qui seraient des termes du domaine étudié ou le repérage de syntagmes nominaux à l’aide de marqueurs qui permet de relever des termes complexes dans un corpus. Nous présentons aussi quelques outils développés en fonction de ces méthodes.<br /> <br /> Par ailleurs, le sujet de notre mémoire est lié au projet de gestion de bases documentaires disponibles sur l’intranet chez Thales. L’un des objectifs du département gestion des connaissances est de faciliter l’indexation des documents et l’interrogation de ces bases par les usagers eux-mêmes. Ceci peut être fait en mettant à disposition des thesauri. Si la langue officielle du groupe est l’anglais, l’idéal d’une langue unique est difficile à atteindre et nombreux sont les documents français présents dans les bases documentaires. Afin de faciliter l’indexation, des thesauri bilingues anglais / français sont réalisés ab initio pendant le stage pour deux communautés pilotes.<br /> <br /> Nous commençons donc par présenter les activités de ces deux communautés, l’existant en matière de plan de classement chez Thales et les besoins des utilisateurs pour la recherche documentaire notamment. De là, en découle une méthode de conception de thesaurus en fonction du contexte applicatif de l’entreprise : nous proposons un thesaurus qui possède les propriétés du thesaurus et la structure d’une classification.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2016" hreflang="fr">linguistique de corpus</a></div> <div class="field__item"><a href="/taxonomy/term/2080" hreflang="fr">ressource terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2081" hreflang="fr">thesaurus</a></div> <div class="field__item"><a href="/taxonomy/term/1804" hreflang="fr">classification</a></div> <div class="field__item"><a href="/taxonomy/term/2082" hreflang="fr">base de données documentaire</a></div> <div class="field__item"><a href="/taxonomy/term/1827" hreflang="fr">indexation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 150 at https://ertim.inalco.fr Constitution de ressources pour l'élaboration d'un lexique français-anglais-chinois du commerce international https://ertim.inalco.fr/node/142 <span class="field field--name-title field--type-string field--label-hidden">Constitution de ressources pour l&#039;élaboration d&#039;un lexique français-anglais-chinois du commerce international</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire présente une méthode de construction d&#039;un lexique trilingue à partir de corpus. Nous utilisons un ensemble de documents juridique de l&#039;OMC traduits dans les 3 langues. Nous examinons d&#039;abord la définition du terme dans les trois langues, puis nous survolons les travaux déjà réalisés en acquisition automatique de terminologies à partir de corpus. Etant données les caractéristiques différentes des trois langues traitées, différents outils ont été utilisés dans le but d&#039;automatiser l&#039;étape d&#039;extraction de termes. Durant la tâche d&#039;acquisition de termes chinois, les complexités posées par cette langue sont mises en lumière.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2041" hreflang="fr">terme</a></div> <div class="field__item"><a href="/taxonomy/term/2042" hreflang="fr">candidat-terme</a></div> <div class="field__item"><a href="/taxonomy/term/2016" hreflang="fr">linguistique de corpus</a></div> <div class="field__item"><a href="/taxonomy/term/865" hreflang="fr">extraction terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/1839" hreflang="fr">segmentation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 142 at https://ertim.inalco.fr Le Projet Pertomed. Création d'une terminologie français/russe dans le domaine de la pharmacovigilance à partir de corpus comparables https://ertim.inalco.fr/node/135 <span class="field field--name-title field--type-string field--label-hidden">Le Projet Pertomed. Création d&#039;une terminologie français/russe dans le domaine de la pharmacovigilance à partir de corpus comparables</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Nous avons élaboré une terminologie bilingue français / russe susceptible de faciliter l&#039;automatisation des traductions dans le domaine de la pharmacovigilance – qui relève du domaine biomédical et pharmacologique –, mais aussi l’uniformisation du codage de l’information biomédicale en russe, qui reste pour l’instant très hétérogène compte tenu du manque de données spécifiques à cette langue dans les grandes bases de données internationales. En partant d’un corpus déjà défini en français, composé principalement des Résumés des Caractéristiques du Produit, nous avons constitué un corpus comparable pour le russe de 14 000 mots. Les résultats se présentent sous la forme d’un tableau où figurent en version bilingue 485 mots-vedettes, tous des substantifs, les syntagmes nominaux où ceux-ci apparaissent en tête ou en expansion, ainsi que les références permettant de rattacher ces termes aux sous-domaines auxquels ils appartiennent.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2016" hreflang="fr">linguistique de corpus</a></div> <div class="field__item"><a href="/taxonomy/term/2017" hreflang="fr">linguistique textuelle</a></div> <div class="field__item"><a href="/taxonomy/term/1782" hreflang="fr">corpus comparables</a></div> <div class="field__item"><a href="/taxonomy/term/2018" hreflang="fr">lexique bilingue français / russe</a></div> <div class="field__item"><a href="/taxonomy/term/2019" hreflang="fr">pharmacovigilance</a></div> <div class="field__item"><a href="/taxonomy/term/1766" hreflang="fr">terminologie médicale</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 135 at https://ertim.inalco.fr