normes lexicographiques

Du dictionnaire de langue au lexique TAL - la construction d'une ressource pour l'annotation sémantique des textes

Résumé
Ce mémoire présente la construction d'une nouvelle ressource lexicale dans le cadre du projet DIXEM (ATILF).

Nous montrons en quoi ce lexique est alternative et complémentaire aux ressources existantes et quelles sont les utilisations envisagées. Nous présentons aussi de manière succincte les aspects de notre cadre théorique majeur (i.e. la sémantique textuelle) qui sont directement liés à la construction de la ressource.

La partie principale est consacrée à la description des stratégies mises en œuvre pour normaliser et structurer les données (semi)brutes issues de la conversion du TLFi.

La normalisation consiste surtout à regrouper les formes morphologiquement apparentées utilisées pour désigner les traits sémantiques des unités lexicales.

La structuration s'applique aux définitions lexicographiques. L'objectif est de récupérer le plus possible l'information sémantique encodée dans les structures formelles des définitions.

A la fin, nous décrivons quantitativement les résultats obtenus et nous donnons quelques exemples de sémèmes pour illustrer le travail  effectué.