extraction

Recherche méthodologique pour l’élaboration d’un dictionnaire de l’ingénierie nucléaire

Résumé
A ce jour, il existe bien évidemment différents dictionnaires, lexiques, vocabulaires du nucléaire. Il convient donc de s’interroger sur l’intérêt de rajouter un nouveau dictionnaire à toutes ces publications. Mais consulter successivement l’ensemble des publications – incomplètes, obsolètes voir dépassées – peut s’avérer fastidieux. L’idée s’est faite jour d’un Dictionnaire complet de référence validé par les acteurs du nucléaire qui intégrerait l’ensemble des termes et expressions employés par les ingénieurs du nucléaire avec des définitions suffisamment explicites et des équivalences étrangères pour que toute personne en relation avec cette discipline puisse disposer d’un service complet, fiable et à sa portée. Enfin, il semble essentiel d’assurer la transmission des connaissances entre les générations du nucléaire.

La méthodologie, jugée la mieux adaptée à la réalisation de ce projet, comprend quatre étapes, à savoir l’élaboration d’un cahier des charges et des fiches terminologiques types pour les termes et expressions, une compilation pour chaque terme et expression des sources disponibles en un document « Master », la validation des termes à définir grâce à l’extraction de candidats termes sur corpus faite avec SYNTEX, la création d’un site intranet interactif accueillant les termes et définitions accessible aux membres du groupe constitué par dompaine pour entériner les termes et définitions, la création d’une base de données au format XML qui sera facilement exploitable par la suite et qui permettra d’enrichir le logiciel de t raduction automatique interne à Framatome.

Outils d'extraction et d'alignement terminologiques franco-japonais

Résumé
Ce mémoire propose une méthode pour constituer des ressources lexicales type glossaire, lexique etc. bilingues japonais français. Dans ce but, un outil d’extraction terminologique pour le japonais, ACABIT, y sera présenté et testé. Sur la base des termes extraits à partir d’un corpus à l’origine bilingue et ensuite alignés, nous avons pu élaborer des unités de traduction qui peuvent servir de base à la construction de ressources lexicales bilingues. Ce mémoire apporte également une évaluation et une critique des outils et logiciels étudiés et de la méthode envisagée.

EJE : Outil d’extraction d’entités nommées en japonais à partir de textes alignés japonais-langue2

Résumé
Le but de ce projet était d'automatiser l’extraction d’entités nommées en japonais afin de faciliter leur reconnaissance dans une autre langue et ce, dans le cadre d’un alignement textuel.L'outil créé prend donc en entrée un couple de textes alignés japonais-langue2 et effectue l'extraction des entités en japonais. L'utilisation de l'unicode pour les traitements et l'affichage autorise l'utilisateur à choisir en langue2 la langue de son choix.Un affichage sous forme de tableau html permet ensuite à l'utilisateur de visualiser les phrases japonaises contenant ces entités surlignées ainsi que les phrases équivalentes dans la deuxième langue.

Construction de ressources terminologiques à l'usage d'interprétes bénévoles d'une mission de promotion de la santé auprés de femmes chinoises se prostituant

Résumé
Notre recherche a consisté à développer une méthode pour constituer des ressources lexicales à l'usage d'interprétes bénévoles français-chinois d'une mission de Médecins du Monde auprés de femmes chinoises qui se prostituent.

Les questions abordées dans le cadre du travail sur le terrain ayant souvent trait à l'intime, il a fallu trouver des solutions pour aborder des thématiques à premiére vue scabreuses.

Nous avons analysé des cas très précis et proposé des solutions sur mesures.