multilingue

Création de ressources linguistiques multilingues ACG pour la génération de rapports

Résumé
Yseop est une entreprise française spécialisée dans l’Intelligence Artificielle et la Génération Automatique de Textes en Langage Naturel. Présente en France (Paris, Lyon), en Angleterre, aux États-Unis, ainsi qu’en Colombie, l’entreprise commercialise un logiciel de génération automatique de textes, permettant de créer différents types de documents, comme des rapports d’activités, des FAQ intelligentes... Ce mémoire porte sur les travaux effectués lors de mon stage chez Yseop, dans le cadre d’un nouveau projet visant à créer un système de génération automatique de textes standardisé, flexible et facilement réutilisable. Les travaux et recherches effectués porteront principalement sur la création de ressources linguistiques multilingues dans le formalisme des Grammaires Catégorielles Abstraites (ACG). Le projet portant notamment la génération de rapports, la partie sémantique de la bibliothèque créée sera organisée sous forme d’une ontologie comprenant les principaux concepts relatifs à ce domaine.

Recherche de termes équivalents à partir de corpus trilingues : constitution d'une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération

Résumé
Les présentes recherches visent à constituer une terminologie multilingue dans le cadre du projet SAFIR (Système d'Agents pour le Filtrage de l'Information sur les Réseaux) concernant la recherche d'information (en français, anglais et allemand) dans le domaine de la cogénération. A partir de listes terminologiques indépendantes, construites à l'aide d'outils d'extraction de terminologie (LEXTER, XELDA), nous essayons de reconnaître les équivalents français,anglais et allemands dans des textes parallèles alignés. Nous comparons les résultats de l'outil 'Twente', qui aligne des textes au niveau des mots, et d'un outil développé par nos soins ('MagicTermFinder'). Les analyses nous montrent que le travail à effectuer se situe surtout au niveau de la préparation et de l'application des termes. Dans une perspective plus lointaine, cette mise en relation terminologique devra être adaptée à des corpus comparables

La terminologie : de la théorie à la pratique

Résumé
Dans un contexte global au sein de Valeo, nombreux sont ceux qui communiquent avec des collègues et partenaires extérieurs qui ne partagent pas la même langue. Tous les documents et communications devraient être rédigés en anglais, mais cet idéal, même avec les meilleures intentions de chacun, est difficile à atteindre du jour au lendemain et dans tous les domaines de spécialité.

Partant d’une dizaine de glossaires répertoriés dans une base documentaire, nous tenterons d’établir et de mettre en place une base terminologique de référence pour l’entreprise en vue d’aider à la compréhension et à la traduction des termes spécifiques.

Dans cette perspective, nous dressons une cartographie générale des positions abordées en terminologie, nous présenterons les normes existantes. Puis, nous décrirons les étapes qui nous conduirons à la décision de conserver ou d’adapter les normes pour un modèle de terminologie interne à l’entreprise. Et enfin, nous décrirons les étapes choisies et les outils utilisés pour normaliser les données.

Recherche méthodologique pour l’élaboration d’un dictionnaire de l’ingénierie nucléaire

Résumé
A ce jour, il existe bien évidemment différents dictionnaires, lexiques, vocabulaires du nucléaire. Il convient donc de s’interroger sur l’intérêt de rajouter un nouveau dictionnaire à toutes ces publications. Mais consulter successivement l’ensemble des publications – incomplètes, obsolètes voir dépassées – peut s’avérer fastidieux. L’idée s’est faite jour d’un Dictionnaire complet de référence validé par les acteurs du nucléaire qui intégrerait l’ensemble des termes et expressions employés par les ingénieurs du nucléaire avec des définitions suffisamment explicites et des équivalences étrangères pour que toute personne en relation avec cette discipline puisse disposer d’un service complet, fiable et à sa portée. Enfin, il semble essentiel d’assurer la transmission des connaissances entre les générations du nucléaire.

La méthodologie, jugée la mieux adaptée à la réalisation de ce projet, comprend quatre étapes, à savoir l’élaboration d’un cahier des charges et des fiches terminologiques types pour les termes et expressions, une compilation pour chaque terme et expression des sources disponibles en un document « Master », la validation des termes à définir grâce à l’extraction de candidats termes sur corpus faite avec SYNTEX, la création d’un site intranet interactif accueillant les termes et définitions accessible aux membres du groupe constitué par dompaine pour entériner les termes et définitions, la création d’une base de données au format XML qui sera facilement exploitable par la suite et qui permettra d’enrichir le logiciel de t raduction automatique interne à Framatome.

Conception et Développement de l’Interface Graphique Utilisateur de TRICK™, synergiciel de TAO avec mémoire de traduction multilingue

Résumé
En traduction humaine assistée par la machine (THAM), le processus de traduction peut se résumer en 3 grandes phases : la préparation des documents, la traduction à proprement dite et la révision. Babeling, société d’édition de logiciels de traitement des langues et du savoir, lance le projet d’intégrer à Lexsyn (son synergiciel lexico-terminologique multilingue en ligne) un synergiciel multilingue d’aide à la traduction (TAO) en ligne, basé sur une Mémoire de Traduction (MT). Mon intervention dans le projet TRICK se situe au niveau du développement et de l’implémentation de l’Interface Graphique Homme-Machine (IGHM). Puisque traducteurs et réviseurs travaillent le même document, une seule interface modulaire devra gérer toutes les opérations. TRICK se veut donc conviviale et facile d’accès afin de gagner du temps dans l’apprentissage du logiciel tout en offrant toutes les fonctionnalités nécessaires à la gestion des traductions et des projets. Après une étude des outils présents sur le marché, il nous a fallu abattre les barrières levées par le multilinguisme ainsi que celles du partage des connaissances (en particulier de la MT) en temps réel tout en tenant compte des contraintes imposées par le cahier des charges.

Terminologie ponctuelle – De la « Feuille de route » à la « hudna » : la guerre des mots

Résumé
Le concept d’un processus de paix pour régler le conflit israélo-palestinien n’es pas récent, et pourtant, l’analyse des documents officiels liés à la « feuille de route », le dernier plan de paix international révèle une nouvelle terminologie : « feuille de route », « quatuor », « hudna », « intifada »… Le choix des termes n’est pas innocent et révèle la pensée profonde de ceux qui les utilisent. Dans ce conflit, la guerre des mots qui a lieu dans les médias est aussi importante que celle que les deux parties se livrent sur le terrain. La « hudna » n’est pas une simple « trêve », de même que le mot « intifada » ne signifie plus « guerre des pierres ». Si le sens réel de ces emprunts à l’arabe est difficilement perceptible pour nos consciences occidentales, quelle idéologie cachent-ils ? Qu’en est-il pour le traducteur, dont l’art repose sur le choix du terme juste ? Autant de questions auxquelles la terminologie ponctuelle tente de répondre.