candidat terme

Création de ressources lexicales bilingues français-macédonien, à partir de corpus parallèles

Résumé
Dans le présent mémoire nous proposons une méthodologie de création de ressources lexicales (glossaires, lexiques etc.) par extraction terminologique automatique à partir de corpus parallèles français-macédonien.

Une telle méthodologie contribuera à l'enrichissement du fond modeste des ressources lexicales existant pour ce couple de langues.

Dans un premier temps nous allons décrire le processus de constitution et de prétraitement du corpus. Ensuite, nous allons nous pencher sur l'extraction terminologique et l'alignement des candidats termes.

Nous présentons les outils de TAL utilisés à ce propos, leurs points forts et leurs limites. Les difficultés rencontrées lors de la démarche entreprise seront également traitées. Enfin nous allons dresser un bilan du travail effectué et de la possibilité d'automatisation du processus de création de ressources lexicales français-macédonien.