information https://ertim.inalco.fr/ fr Détection de contenu utile depuis des sites d’actualité https://ertim.inalco.fr/node/579 <span class="field field--name-title field--type-string field--label-hidden">Détection de contenu utile depuis des sites d’actualité</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2015</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Dans un contexte de veille sur des sites d’actualité, la détection automatique du contenu rédigé par les journalistes est nécessaire au bon déroulement de traitements linguistiques automatisés. Nous adressons ce sujet en partant du constat que sur un même site d’actualité c’est principalement le contenu textuel porteur d’information qui change d’une page à l’autre. Plus généralement, nous définissons le contenu utile comme le contenu textuel qui diffère entre deux pages internet du même site. Nous utilisons différentes heuristiques et une comparaison par distance d’édition entre arbres HTML de mêmes structures pour déterminer ce contenu utile. Nous montrons que notre approche améliore les résultats par rapport à un outil de référence sur un corpus composé de pages récentes issues de différents sites d’actualité.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1938" hreflang="fr">internet</a></div> <div class="field__item"><a href="/taxonomy/term/2357" hreflang="fr">structure</a></div> <div class="field__item"><a href="/taxonomy/term/2358" hreflang="fr">contenu</a></div> <div class="field__item"><a href="/taxonomy/term/1759" hreflang="fr">information</a></div> <div class="field__item"><a href="/taxonomy/term/2359" hreflang="fr">détection</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/report.pdf" type="application/pdf">report.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 579 at https://ertim.inalco.fr Les méthodes et les spécificités de l’indexation de la presse écrite et de la vidéo pour la télévision ( étude du cas de la chaîne de l’information TF1) https://ertim.inalco.fr/node/127 <span class="field field--name-title field--type-string field--label-hidden">Les méthodes et les spécificités de l’indexation de la presse écrite et de la vidéo pour la télévision ( étude du cas de la chaîne de l’information TF1)</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La Gestion de l’Information dans le domaine des média audiovisuels est le pilier de la fabrication du Journal Télévisé. Dans la chaîne documentaire (de l’étape de l’acquisition de l’information jusqu’à sa recherche par les journalistes) il y a différents systèmes qui doivent fonctionner de façon cohérente et homogène. Pour d’avantage de performances du fonctionnement de la chaîne documentaire, les méthodes et les spécificités d’indexation doivent être en harmonie et en correspondance avec les outils de traitement de fiches et de recherche dans la base de données. L’objectif de notre étude est d’analyser la méthodologie d’indexation des documents textuels et vidéo, de détecter les failles dans la chaîne et/ou d’établire les incohérences, et par la suite de faire des propositions d’améliorations en application à la recherche.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1975" hreflang="fr">GED (Gestion électronique des documents)</a></div> <div class="field__item"><a href="/taxonomy/term/1976" hreflang="fr">chaîne documentaire</a></div> <div class="field__item"><a href="/taxonomy/term/1759" hreflang="fr">information</a></div> <div class="field__item"><a href="/taxonomy/term/1977" hreflang="fr">document</a></div> <div class="field__item"><a href="/taxonomy/term/1978" hreflang="fr">catalogage</a></div> <div class="field__item"><a href="/taxonomy/term/1827" hreflang="fr">indexation</a></div> <div class="field__item"><a href="/taxonomy/term/1979" hreflang="fr">méthodologie</a></div> <div class="field__item"><a href="/taxonomy/term/1980" hreflang="fr">mot clé</a></div> <div class="field__item"><a href="/taxonomy/term/1798" hreflang="fr">recherche</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 127 at https://ertim.inalco.fr NTIC & éthiques: quelle valeur posséde l'information en ligne ? https://ertim.inalco.fr/node/75 <span class="field field--name-title field--type-string field--label-hidden">NTIC &amp; éthiques: quelle valeur posséde l&#039;information en ligne ?</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Gareon</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L&#039;avénement de la société de l&#039;information redéfinit l&#039;économie en une &#039;nouvelle économie&#039; numérique. L&#039;entreprise doit apprendre à communiquer différemment pour profiter des opportunités commerciales que lui offre le Web. Le consommateur, quant à lui, ne se contente plus de subir l&#039;information en spectateur passif.<br /> <br /> Les outils de recherches &#039;moteurs de recherche en téte&#039; ont remplacé les documentalistes et sont aujourd&#039;hui plébiscités. Les modéles économiques qui y sont rattachés introduisent des biais supplémentaires dans la recherche et le traitement de l&#039;information par le consommateur final.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1758" hreflang="fr">moteur de recherche</a></div> <div class="field__item"><a href="/taxonomy/term/1759" hreflang="fr">information</a></div> <div class="field__item"><a href="/taxonomy/term/1760" hreflang="fr">e-business</a></div> <div class="field__item"><a href="/taxonomy/term/1761" hreflang="fr">multilinguisme</a></div> <div class="field__item"><a href="/taxonomy/term/1762" hreflang="fr">valeur</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 75 at https://ertim.inalco.fr