solution opérationnelle

Étude de possibilites d'amélioration de l'apprentissage supervisé d'entites nomméés pour les institutions financières

Résumé
Ce mémoire porte sur les possibilités d'augmenter le taux de reconnaissance des institutions financières désignées comme récepteurs dans les messages de paiement bancaire, dans le but de réaliser le STP (anglicisme qui signifie traitement sans rupture ni délai), c'est-à-dire la « réparation » et le routage automatique de ces messages. Les messages de paiement sont écrits par des êtres humains en langage naturel, ce qui fait que la reconnaissance des informations que ceux-ci contiennent nécessite des connaissances en traitement automatique des langues. Plus précisément, certaines techniques de classification sont utilisées pour reconnaître les catégories auxquelles les informations dans les messages de paiement appartiennent, afin de trouver l'entrée correspondante dans la base de référence fournie par le client et effectuer le routage de messages vers l'institution sélectionnée par le programme comme solution. La chaîne de STP est composée de plusieurs processus : la normalisation des champs extraits des messages de paiement, le découpage de champs en segments, l'étiquetage de segments, la requête à la base de référence, la décision à l'aide des réseaux de neurones et le renvoi de solution. Dans le cadre de ce mémoire seuls le découpage et l'étiquetage (en l'occurrence désignés par un seul terme « classification ») sont discutés. Afin de mieux comprendre le mécanisme de classification, plusieurs classifieurs (modèles graphiques) courants sont abordés : CRF, SVM et réseaux bayésiens renforcés par des fonctions de croyance. Ces derniers sont utilisés à FircoSoft parce qu'ils correspondent bien à notre besoin spécifique. Les problèmes existants de reconnaissance nous incitent à chercher des solutions adaptées. Cependant, les contraintes opérationnelles nous empêchent d'effectuer des changements profonds (notamment modification d'algorithmes) et nous optons pour des ajustements locaux tels que la manipulation de statistiques et la transformation virtuelle de corpus de test. Néanmoins, l'amélioration d'algorithme et la réorganisation de fichiers de ressource sont envisageables pour la nouvelle version de l'application de STP.