corpus d’images | Textes, Informatique, Multilinguisme

Traitement automatique de ressources textuelles pour l’indexation de l’image. Etude de cas : La collection du Musée International d’Art Naïf

L’objectif de notre étude est l’indexation d’un corpus d’images conservées dans une banque de données afin de les retrouver au travers de ressources textuelles qui leur sont liées. Le corpus est constitué de 897 photos d’objets d’art (tableaux, dessins, sculptures…) issus de la collection du Musée International d’Art Naïf de Vicq. Une typologie des textes et fragments textuels liés au corpus d’images a été établie, avant de définir des méthodes et outils de TAL pour leur traitement. L’outil principal créé est une hiérarchie de mots-clés. Il s’agit d’une version simplifiée et très réduite du thesaurus iconographique de François Garnier, réalisée après adaptation au corpus d’images et enrichissement au moyen d’un traitement automatique de ressources textuelles liées à ce corpus.

En savoir plus sur Traitement automatique de ressources textuelles pour l’indexation de l’image. Etude de cas : La collection du Musée International d’Art Naïf