extraction de données

Optimisation et amélioration du process de traduction des rapports d'intervention pour service Europe

Résumé
Ce travail s’inscrit dans le cadre du projet CHU (Complaint Handling Unit) Translation Productivity au sein de GEHC à Buc, France. Le travail effectué consiste à optimiser l'extraction, le traitement des rapports d'intervention générés dans les systèmes de gestion de services dans plusieurs langues, ainsi que leur traduction réalisée à la demande de la FDA (Food and Drug Administration). Le projet a été réalisé entre l’équipe de Traduction, de Global Services et de Sourcing. Nous analysons donc le problème de traitement de rapports, ainsi que la difficulté de la traduction technique dans le domaine médical. La solution mise en oeuvre consiste à gérer spécifiquement la concaténation et la segmentation des textes à traduire, en tenant compte de la mémoire de traduction et des portions déjà rédigées en anglais dans les textes sources. Le résultat de ce travail permet d'améliorer l'effet de levier et de réduire les coûts de traduction.

Extraction et structuration de connaissances issues de Wikipedia pour la construction d'une ontologie des êtres humains

Résumé
Ce mémoire a pour objectif la conception d'un outil d'aide à la construction d'une ontologie des entités nommées (EN) pour une application en désambiguïsation sémantique.

C'est un outil qui s'appuie sur les données structurées de Wikipedia, ayant pour fonction d'extraire des faits (entités et relations entre ces entités), de les injecter dans une base de données pour permettre de les interroger, et enfin de proposer des étiquettes à adjoindre aux entités qui aideront à les conceptualiser.