TAL

Les agents conversationnels

Résumé
Ce mémoire propose d'étudier les agents conversationnels. La première partie sera consacrée à la définition et à la description des agents et de leur application. Elle comprendra également un état de l'art des outils existants et une présentation de l'agent ALICE et du langage AIML.La deuxième partie s'intéressera à l'aspect linguistique de ces agents. Elle sera introduite par une brève présentation du dialogue homme-machine et des systèmes de question réponse. Une étude relative aux agents de langue anglaise sera l'occasion de soulever les difficultés en matière d'adaptation de ces agents au français. Une présentation des quelques agents en langue française existants, permettra de vérifier certaines des hypothèses formulées. La conclusion sera l'occasion de faire un point sur le sujet et de poser la question du comportement des utilisateurs face à ces interfaces. 

Etude contrastive des données morphologiques dans les documents médicaux scientifiques et vulgarisés

Résumé
Dans ce travail, nous proposons une étude contrastive des documents médicaux catégorisés par trois discours : vulgarisé, étudiant et professionnel. Nous nous intéressons en particulier de savoir s'il existe des traits saillants du niveau morphologique dans ces types de documents.

Le travail est effectué avec des données de trois domaines médicaux : pneumologie, cardiologie et diabète.

Nous appliquons des méthodes du traitement automatique de langue et d'apprentissage supervisé, accompagnées d'une analyse manuelle détaillée et précise. Nos résultats montrent qu'il existe effectivement des traits morphologiques (et lexicaux associés) propres aux discours étudiés.

Qu'il s'agisse des familles morphologiques (leur composition, taille, ...) ou d'algorithmes d'apprentissage, des caractéristiques discursives propres à ces corpus émergent.

Création de ressources lexicales bilingues français-macédonien, à partir de corpus parallèles

Résumé
Dans le présent mémoire nous proposons une méthodologie de création de ressources lexicales (glossaires, lexiques etc.) par extraction terminologique automatique à partir de corpus parallèles français-macédonien.

Une telle méthodologie contribuera à l'enrichissement du fond modeste des ressources lexicales existant pour ce couple de langues.

Dans un premier temps nous allons décrire le processus de constitution et de prétraitement du corpus. Ensuite, nous allons nous pencher sur l'extraction terminologique et l'alignement des candidats termes.

Nous présentons les outils de TAL utilisés à ce propos, leurs points forts et leurs limites. Les difficultés rencontrées lors de la démarche entreprise seront également traitées. Enfin nous allons dresser un bilan du travail effectué et de la possibilité d'automatisation du processus de création de ressources lexicales français-macédonien.