ontologie

Création de ressources linguistiques multilingues ACG pour la génération de rapports

Résumé
Yseop est une entreprise française spécialisée dans l’Intelligence Artificielle et la Génération Automatique de Textes en Langage Naturel. Présente en France (Paris, Lyon), en Angleterre, aux États-Unis, ainsi qu’en Colombie, l’entreprise commercialise un logiciel de génération automatique de textes, permettant de créer différents types de documents, comme des rapports d’activités, des FAQ intelligentes... Ce mémoire porte sur les travaux effectués lors de mon stage chez Yseop, dans le cadre d’un nouveau projet visant à créer un système de génération automatique de textes standardisé, flexible et facilement réutilisable. Les travaux et recherches effectués porteront principalement sur la création de ressources linguistiques multilingues dans le formalisme des Grammaires Catégorielles Abstraites (ACG). Le projet portant notamment la génération de rapports, la partie sémantique de la bibliothèque créée sera organisée sous forme d’une ontologie comprenant les principaux concepts relatifs à ce domaine.

Détection et caractérisation d’événements dans des rapports de maintenance

Résumé
Dans un contexte d’exploitation des retours d’expérience à des fins préventives, ce travail porte sur la détection de la réalisation d’événements dans des rapports de maintenance. Partant du constat qu’une simple recherche par mots-clés ne suffit à détecter leur réalisation, la chaîne de traitement présentée intègre des méthodes symboliques. Elle se concentre sur le problème du traitement de mention d’événements non-accomplis (négations et futur), ainsi que celui de la construction de ressources terminologiques (sous forme d’ontologie) adaptées à ces textes non formalisés. Ce travail porte également sur l’apport possible de méthodes statistiques en utilisant notamment l’apprentissage automatique pour la classification de ces événements selon un critère lié à l’anticipation des actions de maintenance.

Gestion de l’information dans le cadre de l’internationalisation d’un logiciel

Résumé
Il existe aujourd’hui une grande diversité de logiciels sur le marché, et ceux-ci ont pris une place importante dans notre vie quotidienne, aussi bien au travail qu’à la maison. Désormais, l'objectif principal des éditeurs n'est plus seulement de vendre, mais aussi d'exporter leurs produits. On parle alors d’internationalisation, qui consiste à concevoir un logiciel de façon à ce qu'il s'adapte aisément à divers paramètres socioculturels : cela permet d’une part de faciliter sa localisation, et d'autre, de réduire les coûts et de d’accélérer la commercialisation. Le rédacteur technique à un rôle important à jouer : il participe à la création du logiciel en rédigeant la description de son contenu, mais également en écrivant la documentation utilisateur. Ce travail traitera des problèmes spécifiques liés à la conception d’un logiciel et à la structuration d'une aide en ligne, et couvrira une ontologie du domaine de la conception d'un logiciel, et plus particulièrement de l’aide en ligne en français et en anglais.

Web sémantique, Multilinguisme, dans le domaine du Tourisme

Résumé
Le Web Sémantique est au cœur du débat sur le futur du web.

Le rendre accessible à tous suppose qu’il soit ouvert à toutes les langues et c’est le cas grâce au langage XML. Or il se heurte aux problématiques liées au multilinguisme, notamment la modélisation des ontologies.

Dans le domaine du tourisme, les internautes ont massivement adopté l’Internet comme mode de recherche d’information pour préparer leurs vacances. C’est pourquoi cette industrie représente un domaine particulièrement favorable aux applications du web sémantique tant sur le plan de la gestion de l’information et de l’indexation que sur un plan multilingue.

L’étude du portail touristique de l’Agence de Développement Touristique de la Nièvre, dont le contenu et les connaissances sont gérés par l’entreprise Mondeca, permet de mesurer, à échelle réduite, l’état d’avancement et la pertinence du projet de Web Sémantique. 

The Semantic Web is at the heart of the debate on the future of the Web.

Thanks to XML language it is now openly available to everyone. But it faces multilingual problems most notably the modeling of ontologies.

In the field of tourism, the web surfers massively adopted the Internet as a means to seek information to prepare their holidays. This is why this industry represents a field particularly favorable to the applications of the semantic Web as much as in indexing and information management as on a multilingual level.

The study of the tourist web site of the Tourist Agency of Development of Nievre, whose contents and knowledge are managed by the Mondeca company, makes it possible to measure, on a reduced scale, the progress and the relevance of the project of the Semantic Web.

Le web sémantique a-t-il un avenir

Résumé
Le Web sémantique, imaginé en 1998 par Tim Berners-Lee, se propose d'étendre le World Wide Web aux machines, de créer un réseau d'informations qui soit accessible et utilisable par des programmes informatiques.

Depuis que l'idée du Web sémantique a émergé, le Web a évolué de son côté, de façon parfois incompatible avec la proposition du Web sémantique.

Dans notre mémoire, nous nous attacherons à étudier les différentes évolutions du Web et du Web sémantique, les problèmes que pose l'implémentation de ce dernier et les évolutions qui le concurrencent.

Les ontologies en ingénierie des connaissances

Résumé
Connues comme réponse aux problèmes posés par l'intégration de connaissances au sein des systèmes informatiques, les ontologies apparaissent désormais comme une clé pour la manipulation automatique de l'information au niveau sémantique.Dans ce mémoire, nous présentons deux types d'ontologies : les ontologies générales ou de représentation qui décrivent des concepts généraux et les ontologies de domaine qui décrivent des domaines particuliers.

Bien qu'il n'existe pas de méthode de construction d'ontologies unanimement acceptée, nous présentons en détail les deux principales approches basées sur les notions de terminologie conceptuelle ou de terminologie textuelle. Pour chacune de ces deux approches, nous présentons la méthodologie d'acquisition et de traitement des connaissances.Nous montrons que chacune des deux approches a ses limites que nous présentons en détail.Nous pouvons considérer que le type d'applications et les objectifs visés permettent de choisir entre les différentes approches. Quelle que soit, la méthodologie adoptée, le processus de construction d'une ontologie est une collaboration qui réunit des experts du domaine de connaissance, des ingénieurs de la connaissance, voire les futurs utilisateurs de l'ontologie. Cette collaboration ne peut être fructueuse que si les objectifs du processus ont été clairement définis, ainsi que les besoins qui en découlent.