Prédiction de la difficulté des textes coréens pour les apprenants. Expériences de classification automatique

Auteur

Arthur Provenier

Année

2018

Résumé

Ce mémoire vise à prédire la difficulté de textes pour les apprenants du coréen. À partir d’un corpus élaboré de manuels destinés à l’enseignement du coréen, nous essayons de définir des variables lexicales et syntaxiques qui peuvent nous permettre de discriminer la lisibilité des textes. Après en avoir établi la liste, nous employons des coefficients de corrélation afin de sélectionner les plus pertinentes. Enfin, à l’aide de plusieurs algorithmes de classification automatique, nous essayons de déterminer le modèle le plus efficace.

Mots-clés

lisibilité

coréen langue étrangère

classification

apprentissage automatique

variable lexicale

variable syntaxique