Évaluation d'analyseurs syntaxiques
Résumé
Grammaire de dépendances ou grammaire de constituants? Quel type d'analyseur syntaxique choisir pour la création de classes sémantiques dans le cadre d'un projet d'extraction d'information appliqué à des textes scientifiques de langue anglaise?Les analyseurs les plus connus et les plus utilisés jusqu'alors pour l'anglais sont ceux développés à partir de grammaires syntagmatiques (dites de constituants).Nous verrons en quoi les analyseurs basés sur des grammaires de dépendances permettent d'obtenir de très bons résultats et s'adaptent particulièrement bien à une tâche de classification sémantique.Après avoir fait un état de l'art des deux familles d'analyseurs, nous ferons une présentation plus détaillée d'un analyseur à grammaire de dépendances appelé Link Parser. Nous verrons enfin de quelle manière il a été intégré à un système d'extraction d'information.