apprentissage

Etude contrastive des données morphologiques dans les documents médicaux scientifiques et vulgarisés

Résumé
Dans ce travail, nous proposons une étude contrastive des documents médicaux catégorisés par trois discours : vulgarisé, étudiant et professionnel. Nous nous intéressons en particulier de savoir s'il existe des traits saillants du niveau morphologique dans ces types de documents.

Le travail est effectué avec des données de trois domaines médicaux : pneumologie, cardiologie et diabète.

Nous appliquons des méthodes du traitement automatique de langue et d'apprentissage supervisé, accompagnées d'une analyse manuelle détaillée et précise. Nos résultats montrent qu'il existe effectivement des traits morphologiques (et lexicaux associés) propres aux discours étudiés.

Qu'il s'agisse des familles morphologiques (leur composition, taille, ...) ou d'algorithmes d'apprentissage, des caractéristiques discursives propres à ces corpus émergent.