word embeddings

Correction orthographique de corpus bruités pour l'amélioration d'un agent conversationnel dans le domaine bancaire

Résumé
Ce mémoire porte sur l'étude de l'impact de la correction orthographique sur le taux de compréhension d'un agent conversationnel à domaine fermé en milieu bancaire. L'objectif de ce travail est de développer une solution capable de corriger les erreurs d'orthographe des conversations clients avant que celles-ci ne soient traitées par l'agent conversationnel. Nous avons utilisé le logiciel Hunspell pour générer des candidats à la correction. Dans un premier temps, nous avons centré notre approche sur la correction mot par mot. Par la suite, nous avons utilisé les contextes et les plongements lexicaux afin de sélectionner le meilleur candidat. Enfin, une analyse des résultats obtenus permet de conclure à une amélioration de la compréhension de l'agent conversationnel.