Évaluation d'analyseurs syntaxiques

Année
2002
Résumé
Grammaire de dépendances ou grammaire de constituants? Quel type d'analyseur syntaxique choisir pour la création de classes sémantiques dans le cadre d'un projet d'extraction d'information appliqué à des textes scientifiques de langue anglaise?Les analyseurs les plus connus et les plus utilisés jusqu'alors pour l'anglais sont ceux développés à partir de grammaires syntagmatiques (dites de constituants).Nous verrons en quoi les analyseurs basés sur des grammaires de dépendances permettent d'obtenir de très bons résultats et s'adaptent particulièrement bien à une tâche de classification sémantique.Après avoir fait un état de l'art des deux familles d'analyseurs, nous ferons une présentation plus détaillée d'un analyseur à grammaire de dépendances appelé Link Parser. Nous verrons enfin de quelle manière il a été intégré à un système d'extraction d'information.