automate fini déterministe

Approches pour une numérisation de qualité d’un dictionnaire vietnamien-français comprenant des caractères Nôm

Résumé
la numérisation d’un dictionnaire ancien de vietnamien-français (Bonet 1899) qui fait usage de caractères anciens forgés sur le modèles de caractères chinois pose plusieurs problèmes : le support des dits caractères et la gestion du multilinguisme en particulier. Une architecture logicielle pour adresser le problème est décrite, ainsi que différentes techniques visant à augmenter la qualité de la reconnaissance en sortie.