genre textuel https://ertim.inalco.fr/ fr Critéres pour la catégorisation automatique des documents numériques https://ertim.inalco.fr/node/84 <span class="field field--name-title field--type-string field--label-hidden">Critéres pour la catégorisation automatique des documents numériques</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Krivine</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La recherche d&#039;information par mots-clefs, essentiellement basée sur des informations lexicales, n&#039;offre pas une caractérisation  suffisamment efficace des documents retournés.<br /> <br /> Afin d&#039;améliorer les performances des systèmes de recherche d&#039;information, l&#039;ingénierie documentaire se tourne vers une approche plus globale du texte, prenant en considération sa dimension sociolinguistique.<br /> <br /> La théorie des genres, longtemps réservée au domaine de la littérature, offre des perspectives intéressantes, car les notions de genre et de discours constituent des points d&#039;entrée vers l&#039;identification d&#039;informations pertinentes, autres que thématiques, au sein des textes.<br /> <br /> Dans ce mémoire, nous étudions la pertinence de certains de critéres linguistiques et extralinguistiques pour la caractérisation des discours scientifique et vulgarisé russe du Web et les moyens à mettre en oeuvre pour leur acquisition automatique.<br /> <br /> Cette étude a été réalisée dans le cadre d&#039;un projet TCAN (Traitement des connaissances et NTIC) du CNRS, sur la Découverte et l&#039;exploration des corpus comparables pour l&#039;accés à l&#039;information multilingue (DECO), débuté en 2004.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1800" hreflang="fr">recherche d&#039;information</a></div> <div class="field__item"><a href="/taxonomy/term/1801" hreflang="fr">genre textuel</a></div> <div class="field__item"><a href="/taxonomy/term/1802" hreflang="fr">discours</a></div> <div class="field__item"><a href="/taxonomy/term/1803" hreflang="fr">catégorisation</a></div> <div class="field__item"><a href="/taxonomy/term/1804" hreflang="fr">classification</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 84 at https://ertim.inalco.fr