distinction automatique

Exploitation de critéres de distinction automatique des textes scientifiques et vulgarisés autour des notions "diabéte / régime alimentaire"

Résumé
Aprés avoir constitué deux corpus japonais (scientifique et vulgarisé) dans le cadre du projet DECO, diverses analyses ont été effectuées sur ces corpus pour en dégager des critéres de la distinction automatique des textes scientifiques et vulgarisés.

Des critéres proposés par des études précédentes comme quelques critéres originaux (dont celui de la mise en rapport des styles "neutre / poli" avec les catégories "scientifique / vulgarisé") ont été examinés et exploités.