acquisition de noms de personnes

Pistes méthodologiques pour l'acquisition de noms de personnes à partir du WEB

Résumé
L'acquisition de noms de personnes peut être nécessaire pour des applications en ingénierie linguistique.

Nous avons constitué un lexique de noms de famille de personnes norvégiennes pour un système de reconnaissance d'écriture à l'aide d'une méthode simple qui nous semble manquer de robustesse. Pour essayer de trouver des méthodes alternatives, nous avons étudié la tâche de reconnaissance des entités nommées et les systémes dédiés à celle-ci, ainsi que quelques méthodes d'acquisition d'entités nommées à partir du WEB.

Nous en avons tiré un certain nombre de pistes éventuellement exploitables pour constituer des listes de noms de famille de personnes habitant un pays donné.Ces derniéres sont : l'utilisation de dictionnaires de prénoms, de listes de mots déclencheurs, d'informations de capitalisation et d'informations de formatage des documents HTML.