OpenSource

Quelques axes méthodologiques pour le développement d'un outil de recherche

Résumé
La recherche d'informations opérant sur des données privées constitue un besoin important dans de multiples domaines. Elle est particulièrement utile pour les organisations ou les entreprises qui souhaitent exploiter une base de connaissances. Si l'on souhaite disposer de services comparables à ceux proposés par les moteurs que l'on utilise pour faire des recherches sur le Web, le contrôle des différents processus impliqués dans la mise en œuvre ("page ranking", stratégie d'indexation, méthodes de recherche, etc..) garantit que les spécificités de l'organisation et du corpus seront effectivement prises en compte. Nous proposons ici de faire l'inventaire des différentes problématiques impliquées dans la mise en oeuvre d'un moteur de recherche au sein d'une organisation souhaitant exploiter un corpus de données spécifiques. Nous étudions en outre comment cette mise en œuvre peut se faire à partir de solutions Open source, celles ci proposant à la fois le matériel adéquat et le niveau de qualité requis pour mener à bien ce type de projet. Cet inventaire est abordé sous deux aspects. Le premier concerne les phénomènes linguistiques à traiter, le second, le cadre dans lequel on peut effectivement les mettre en œuvre, c'est à dire à la fois les programmer, les faire évoluer et en assurer une exploitation efficace.