terminologie bilingue

Alignement de mots dans un corpus parallèle pour l'enrichissement de la terminologie médicale

Résumé
Ce mémoire présente une méthode pour repérer des termes médicaux dans un corpus parallèle français-anglais par alignement de mots.

Nous avons deux objectifs: la détection de nouveaux termes médicaux français et la création d'une liste de termes médicaux bilingue.

Aprés avoir exposé nos objectifs et le contexte dans lequel ils s'inscrivent, nous procédons à un état de l'art du domaine de l'alignement puis à la description pratique de la méthode employée (alignement de phrases, alignement de mots puis sélection de termes médicaux).

Nous évaluons les résultats obtenus, qui sont prometteurs (parmi les termes médicaux sélectionnés, nous calculons une précision de 48%) méme si sujets à amélioration.

Nous tentons ensuite d'appliquer notre méthode à un corpus français-hindi en introduisant une difficulté nouvelle, celle posée par une langue "peu dotée".

Nous terminons en discutant les résultats et en proposant des pistes d'amélioration de la méthode.