La génération automatique d'un corpus d'apprentissage pour les serveurs vocaux interactifs
Résumé
Les systèmes de dialogue homme machine tout public par téléphone, connus sous le nom de serveurs vocaux interactifs, ont bénéficié ces dernières années des progrès en reconnaissance vocale.
Cependant, les systèmes les plus robustes fonctionnant sur des modèles statistiques et nécessitant de constituer des corpus conséquents difficilement réutilisables d'une application à une autre, leur réalisation reste longue et coûteuse. Afin de réduire ce problème, ce mémoire proposera une méthode basée sur la génération automatique d'un corpus d'apprentissage, reposant très fortement sur le formalisme des grammaires d'arbres adjoints (TAG).
Les domaines d'application très restreints des serveurs vocaux interactifs se prêtent en effet très bien à la génération automatique (GAT). Ce sera aussi pour nous l'occasion de présenter de manière générale le dialogue homme-machine et la GAT.
Cependant, les systèmes les plus robustes fonctionnant sur des modèles statistiques et nécessitant de constituer des corpus conséquents difficilement réutilisables d'une application à une autre, leur réalisation reste longue et coûteuse. Afin de réduire ce problème, ce mémoire proposera une méthode basée sur la génération automatique d'un corpus d'apprentissage, reposant très fortement sur le formalisme des grammaires d'arbres adjoints (TAG).
Les domaines d'application très restreints des serveurs vocaux interactifs se prêtent en effet très bien à la génération automatique (GAT). Ce sera aussi pour nous l'occasion de présenter de manière générale le dialogue homme-machine et la GAT.