terminologie

Détection et caractérisation d’événements dans des rapports de maintenance

Résumé
Dans un contexte d’exploitation des retours d’expérience à des fins préventives, ce travail porte sur la détection de la réalisation d’événements dans des rapports de maintenance. Partant du constat qu’une simple recherche par mots-clés ne suffit à détecter leur réalisation, la chaîne de traitement présentée intègre des méthodes symboliques. Elle se concentre sur le problème du traitement de mention d’événements non-accomplis (négations et futur), ainsi que celui de la construction de ressources terminologiques (sous forme d’ontologie) adaptées à ces textes non formalisés. Ce travail porte également sur l’apport possible de méthodes statistiques en utilisant notamment l’apprentissage automatique pour la classification de ces événements selon un critère lié à l’anticipation des actions de maintenance.

Recherche de termes équivalents à partir de corpus trilingues : constitution d'une terminologie multilingue français-anglais-allemand, application au domaine de la cogénération

Résumé
Les présentes recherches visent à constituer une terminologie multilingue dans le cadre du projet SAFIR (Système d'Agents pour le Filtrage de l'Information sur les Réseaux) concernant la recherche d'information (en français, anglais et allemand) dans le domaine de la cogénération. A partir de listes terminologiques indépendantes, construites à l'aide d'outils d'extraction de terminologie (LEXTER, XELDA), nous essayons de reconnaître les équivalents français,anglais et allemands dans des textes parallèles alignés. Nous comparons les résultats de l'outil 'Twente', qui aligne des textes au niveau des mots, et d'un outil développé par nos soins ('MagicTermFinder'). Les analyses nous montrent que le travail à effectuer se situe surtout au niveau de la préparation et de l'application des termes. Dans une perspective plus lointaine, cette mise en relation terminologique devra être adaptée à des corpus comparables

La terminologie : de la théorie à la pratique

Résumé
Dans un contexte global au sein de Valeo, nombreux sont ceux qui communiquent avec des collègues et partenaires extérieurs qui ne partagent pas la même langue. Tous les documents et communications devraient être rédigés en anglais, mais cet idéal, même avec les meilleures intentions de chacun, est difficile à atteindre du jour au lendemain et dans tous les domaines de spécialité.

Partant d’une dizaine de glossaires répertoriés dans une base documentaire, nous tenterons d’établir et de mettre en place une base terminologique de référence pour l’entreprise en vue d’aider à la compréhension et à la traduction des termes spécifiques.

Dans cette perspective, nous dressons une cartographie générale des positions abordées en terminologie, nous présenterons les normes existantes. Puis, nous décrirons les étapes qui nous conduirons à la décision de conserver ou d’adapter les normes pour un modèle de terminologie interne à l’entreprise. Et enfin, nous décrirons les étapes choisies et les outils utilisés pour normaliser les données.

Recherche méthodologique pour l’élaboration d’un dictionnaire de l’ingénierie nucléaire

Résumé
A ce jour, il existe bien évidemment différents dictionnaires, lexiques, vocabulaires du nucléaire. Il convient donc de s’interroger sur l’intérêt de rajouter un nouveau dictionnaire à toutes ces publications. Mais consulter successivement l’ensemble des publications – incomplètes, obsolètes voir dépassées – peut s’avérer fastidieux. L’idée s’est faite jour d’un Dictionnaire complet de référence validé par les acteurs du nucléaire qui intégrerait l’ensemble des termes et expressions employés par les ingénieurs du nucléaire avec des définitions suffisamment explicites et des équivalences étrangères pour que toute personne en relation avec cette discipline puisse disposer d’un service complet, fiable et à sa portée. Enfin, il semble essentiel d’assurer la transmission des connaissances entre les générations du nucléaire.

La méthodologie, jugée la mieux adaptée à la réalisation de ce projet, comprend quatre étapes, à savoir l’élaboration d’un cahier des charges et des fiches terminologiques types pour les termes et expressions, une compilation pour chaque terme et expression des sources disponibles en un document « Master », la validation des termes à définir grâce à l’extraction de candidats termes sur corpus faite avec SYNTEX, la création d’un site intranet interactif accueillant les termes et définitions accessible aux membres du groupe constitué par dompaine pour entériner les termes et définitions, la création d’une base de données au format XML qui sera facilement exploitable par la suite et qui permettra d’enrichir le logiciel de t raduction automatique interne à Framatome.

Terminologie ponctuelle – De la « Feuille de route » à la « hudna » : la guerre des mots

Résumé
Le concept d’un processus de paix pour régler le conflit israélo-palestinien n’es pas récent, et pourtant, l’analyse des documents officiels liés à la « feuille de route », le dernier plan de paix international révèle une nouvelle terminologie : « feuille de route », « quatuor », « hudna », « intifada »… Le choix des termes n’est pas innocent et révèle la pensée profonde de ceux qui les utilisent. Dans ce conflit, la guerre des mots qui a lieu dans les médias est aussi importante que celle que les deux parties se livrent sur le terrain. La « hudna » n’est pas une simple « trêve », de même que le mot « intifada » ne signifie plus « guerre des pierres ». Si le sens réel de ces emprunts à l’arabe est difficilement perceptible pour nos consciences occidentales, quelle idéologie cachent-ils ? Qu’en est-il pour le traducteur, dont l’art repose sur le choix du terme juste ? Autant de questions auxquelles la terminologie ponctuelle tente de répondre.

Terminologie du luxe en chinois

Résumé
L’ouverture de la Chine au monde est bien là mais au-delà de l’image et des perceptions dont l’actualité se fait l’écho, la Chine est un pays en pleine mutation et son entrée sur la scène mondiale a impliqué de nombreux changements dans la société chinoise. Parmi les secteurs qui prennent de plus en plus de place dans la société chinoise, celui du luxe est en pleine expansion. Comment la société fait-elle face à la montée de ce secteur qui suscite à la fois un nouvel intérêt mais implique également l’utilisation d’une terminologie spécifique? A travers une étude comparative des termes du luxe extraits des versions française et chinoise de sites Web d'entreprises de luxe français, nous tenterons d’établir un glossaire terminologique du luxe en français et en chinois. Pour ce faire, il est important de s’interroger dans un premier temps sur la place du marché du luxe en Chine et dans un deuxième temps, sur les différences linguistiques qu’il existe entre les termes français et les termes chinois.

Traduction humaine dans la perspective du développement de la traduction automatique

Résumé
Dans mon mémoire de DESS, j'aborde la problématique linguistique (traduction) dans la perspective du développement informatique (nouvelles technologies-logiciels de traduction automatique). Il s'agit de traiter la question de la traduction « traditionnelle » vs la traduction automatique. L'enjeu de mon travail est de démontrer quels sont les points forts et les points faibles ainsi que les limites et les difficultés liés à ces deux façons de traduire: humaine et informatisée.Pour illustrer mes observations, je m'appuie sur les exemples précis. J'établis un corpus bilingue (langue source français-langue cible anglais) extrait du Journal Officiel de la Communauté européenne et j'examine les traductions: premièrement traditionnelle publiée dans une version anglaise du Journal Officiel, ensuite celle traitée par le logiciel de traduction automatique REVERSO et celle traitée par le logiciel de traduction gratuit disponible sur le moteur de recherche YAHOO. Par la suite, je procède à l’extraction terminologique en établissant une liste des termes et des expressions que je compare premièrement avec la terminologie traditionnelle du dictionnaire-papier, et ensuite avec le dictionnaire en ligne FREELANG et la base terminologique de la Communauté européenne - EUROVOC. Les commentaires des résultats obtenus me servent de conclusion : quels sont la place et le rôle du traducteur face à la prolifération des outils de traduction automatique, quel est l’avenir de la TA et de la TAO de point de vue de l’efficacité, de la disponibilité, du coût et du temps de traduction ? Est-ce que le progrès technologique accompagne les méthodes traditionnelles et en quoi est-il complémentaire? Arrivera-t-on à maîtriser l’ambiguïté du langage humain du point de vue de la traduction?

Extraction d'une terminologie bilingue à partir d'un corpus parallèle regroupant les ressources produites suite à un projet de localisation en arabe de l’environnement Linux

Résumé
Arabeyes est un projet qui vise à produire, et à maintenir à jour, une distribution arabe du système Linux. Ceci nécessite d’importants efforts de traduction, et le développement d’outils logiciels spécifiques. L’objectif de notre travail est d’exploiter tous les travaux de traduction, réalisés dans le cadre de ce projet, afin d’extraire des ressources terminologiques anglais /arabe concernant la localisation des logiciels libres.

La première étape du travail consiste à récupérer, et à filtrer, tous les fichiers contenant les traductions, puis ensuite regrouper les messages provenant de ces fichiers dans un seul corpus parallèle. Pour former une première liste de candidats termes bilingues, nous récupérons tous les messages susceptibles de contenir un seul terme, puis à l’aide d'outils d’analyse morphosyntaxique, nous isolons, dans cette liste, les suites de mots correspondant aux catégories qui présentent plus d’intérêts terminologiques. 

La deuxième étape consiste à implémenter une méthode d’alignement basée sur le calcul des fréquences des cooccurrences. Cette technique d’alignement sera exploitée pour obtenir de nouveaux couples de candidats termes à partir du corpus. Pour filtrer les résultats, nous  comparons les catégories  des suites de mots obtenues, et nous gardons les couples de candidats termes qui se correspondent le plus