fouille de textes

Automatic detection of key events from daily news based on recurrent information analysis

Résumé
Cette étude consiste à détecter les événements majeurs et les documents correspondants dans la presse quotidienne. Notre approche est basée sur l’hypothèse que si deux documents partagent des phrases décrivant les mêmes faits, ils sont susceptibles de faire référence au même événement. Ainsi, nous déterminons la proximité entre les documents en comparant la similarité textuelle au niveau des phrases. Les résultats indiquent que cette approche est efficace pour détecter les "micro" événements.

Complémentarité entre fouille de données et fouille de textes

Résumé
L’objectif de ce mémoire est d’expliciter les liens qui existent entre fouille de données et fouille de textes. Nous commençons par une présentation générale de ces deux disciplines et de quelques disciplines du traitement de l’information telles que la recherche ou l’extraction d’information. Nous étudions ensuite la nature des données manipulées et des tâches accomplies ainsi que les principaux outils et domaines d’application. Nous abordons enfin la question de l’intégration, forte ou faible, de ces techniques dans un même processus, à partir d’exemples pris dans les domaines du biomédical et du marketing.