information

Détection de contenu utile depuis des sites d’actualité

Résumé
Dans un contexte de veille sur des sites d’actualité, la détection automatique du contenu rédigé par les journalistes est nécessaire au bon déroulement de traitements linguistiques automatisés. Nous adressons ce sujet en partant du constat que sur un même site d’actualité c’est principalement le contenu textuel porteur d’information qui change d’une page à l’autre. Plus généralement, nous définissons le contenu utile comme le contenu textuel qui diffère entre deux pages internet du même site. Nous utilisons différentes heuristiques et une comparaison par distance d’édition entre arbres HTML de mêmes structures pour déterminer ce contenu utile. Nous montrons que notre approche améliore les résultats par rapport à un outil de référence sur un corpus composé de pages récentes issues de différents sites d’actualité.

Les méthodes et les spécificités de l’indexation de la presse écrite et de la vidéo pour la télévision ( étude du cas de la chaîne de l’information TF1)

Résumé
La Gestion de l’Information dans le domaine des média audiovisuels est le pilier de la fabrication du Journal Télévisé. Dans la chaîne documentaire (de l’étape de l’acquisition de l’information jusqu’à sa recherche par les journalistes) il y a différents systèmes qui doivent fonctionner de façon cohérente et homogène. Pour d’avantage de performances du fonctionnement de la chaîne documentaire, les méthodes et les spécificités d’indexation doivent être en harmonie et en correspondance avec les outils de traitement de fiches et de recherche dans la base de données. L’objectif de notre étude est d’analyser la méthodologie d’indexation des documents textuels et vidéo, de détecter les failles dans la chaîne et/ou d’établire les incohérences, et par la suite de faire des propositions d’améliorations en application à la recherche.

NTIC & éthiques: quelle valeur posséde l'information en ligne ?

Résumé
L'avénement de la société de l'information redéfinit l'économie en une 'nouvelle économie' numérique. L'entreprise doit apprendre à communiquer différemment pour profiter des opportunités commerciales que lui offre le Web. Le consommateur, quant à lui, ne se contente plus de subir l'information en spectateur passif.

Les outils de recherches 'moteurs de recherche en téte' ont remplacé les documentalistes et sont aujourd'hui plébiscités. Les modéles économiques qui y sont rattachés introduisent des biais supplémentaires dans la recherche et le traitement de l'information par le consommateur final.