modélisation

Une approche quantitative de modélisation des changements sémantiques sur les grandes échelles de données

Résumé
Ce mémoire décrit les recherches qui ont été effectuées sur la modélisation de l’évolution
linguistique. Nous avons analysé les changements sémantiques de noms communs dans la
langue russe sur de grandes bases de données. Grâce à l’analyse quantitative qui a été proposée,
nous avons réalisé une modélisation des phénomènes proprement linguistiques, comme le
changement du sens des mots, à l’aide des outils d’analyse mathématiques et statistiques.
L’hypothèse de présence d’un schéma d’évolution, souvent qualifié d’une courbe en S, lorsque
le changement du sens a eu lieu, a été mathématiquement analysés au sein de ce mémoire.

La terminologie : de la théorie à la pratique

Résumé
Dans un contexte global au sein de Valeo, nombreux sont ceux qui communiquent avec des collègues et partenaires extérieurs qui ne partagent pas la même langue. Tous les documents et communications devraient être rédigés en anglais, mais cet idéal, même avec les meilleures intentions de chacun, est difficile à atteindre du jour au lendemain et dans tous les domaines de spécialité.

Partant d’une dizaine de glossaires répertoriés dans une base documentaire, nous tenterons d’établir et de mettre en place une base terminologique de référence pour l’entreprise en vue d’aider à la compréhension et à la traduction des termes spécifiques.

Dans cette perspective, nous dressons une cartographie générale des positions abordées en terminologie, nous présenterons les normes existantes. Puis, nous décrirons les étapes qui nous conduirons à la décision de conserver ou d’adapter les normes pour un modèle de terminologie interne à l’entreprise. Et enfin, nous décrirons les étapes choisies et les outils utilisés pour normaliser les données.

Extraction et structuration de connaissances issues de Wikipedia pour la construction d'une ontologie des êtres humains

Résumé
Ce mémoire a pour objectif la conception d'un outil d'aide à la construction d'une ontologie des entités nommées (EN) pour une application en désambiguïsation sémantique.

C'est un outil qui s'appuie sur les données structurées de Wikipedia, ayant pour fonction d'extraire des faits (entités et relations entre ces entités), de les injecter dans une base de données pour permettre de les interroger, et enfin de proposer des étiquettes à adjoindre aux entités qui aideront à les conceptualiser.