Sphinx

Approche pour le filtrage de données audio à large vocabulaire

Résumé
Les performances des outils de reconnaissance vocale sur des données à large couverture lexicale permettent d’envisager des traitements automatiques de l’information contenue dans les textes oraux.

Le mémoire décrit une approche de filtrage audio menée au cours d’un stage de 6 mois dans l’entreprise Thales Recherche et Technologie. L’analyse menée sur l’existant et les besoins de l’entreprise a débouché sur la réalisation d’une plate-forme de filtrage audio : RAFT (Realtime Audio Filtering Tool). Elle intègre un système de reconnaissance vocale, Sphinx, et un module de filtrage à l’aide des FSM, librairie d’automates et de transducteurs pondérés. Le mémoire présente la plate-forme et les différents types de filtrage envisagés : à partir de la meilleure transcription, d’un treillis de mots ou d’un treillis de phonèmes.