discours https://ertim.inalco.fr/ fr Etude contrastive des données morphologiques dans les documents médicaux scientifiques et vulgarisés https://ertim.inalco.fr/node/119 <span class="field field--name-title field--type-string field--label-hidden">Etude contrastive des données morphologiques dans les documents médicaux scientifiques et vulgarisés</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Chmielik</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2008</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Dans ce travail, nous proposons une étude contrastive des documents médicaux catégorisés par trois discours : vulgarisé, étudiant et professionnel. Nous nous intéressons en particulier de savoir s&#039;il existe des traits saillants du niveau morphologique dans ces types de documents.<br /> <br /> Le travail est effectué avec des données de trois domaines médicaux : pneumologie, cardiologie et diabète.<br /> <br /> Nous appliquons des méthodes du traitement automatique de langue et d&#039;apprentissage supervisé, accompagnées d&#039;une analyse manuelle détaillée et précise. Nos résultats montrent qu&#039;il existe effectivement des traits morphologiques (et lexicaux associés) propres aux discours étudiés.<br /> <br /> Qu&#039;il s&#039;agisse des familles morphologiques (leur composition, taille, ...) ou d&#039;algorithmes d&#039;apprentissage, des caractéristiques discursives propres à ces corpus émergent.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1942" hreflang="fr">morphologie</a></div> <div class="field__item"><a href="/taxonomy/term/867" hreflang="fr">TAL</a></div> <div class="field__item"><a href="/taxonomy/term/1802" hreflang="fr">discours</a></div> <div class="field__item"><a href="/taxonomy/term/1943" hreflang="fr">apprentissage</a></div> <div class="field__item"><a href="/taxonomy/term/1944" hreflang="fr">corpus médicaux</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 119 at https://ertim.inalco.fr Critéres pour la catégorisation automatique des documents numériques https://ertim.inalco.fr/node/84 <span class="field field--name-title field--type-string field--label-hidden">Critéres pour la catégorisation automatique des documents numériques</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Krivine</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La recherche d&#039;information par mots-clefs, essentiellement basée sur des informations lexicales, n&#039;offre pas une caractérisation  suffisamment efficace des documents retournés.<br /> <br /> Afin d&#039;améliorer les performances des systèmes de recherche d&#039;information, l&#039;ingénierie documentaire se tourne vers une approche plus globale du texte, prenant en considération sa dimension sociolinguistique.<br /> <br /> La théorie des genres, longtemps réservée au domaine de la littérature, offre des perspectives intéressantes, car les notions de genre et de discours constituent des points d&#039;entrée vers l&#039;identification d&#039;informations pertinentes, autres que thématiques, au sein des textes.<br /> <br /> Dans ce mémoire, nous étudions la pertinence de certains de critéres linguistiques et extralinguistiques pour la caractérisation des discours scientifique et vulgarisé russe du Web et les moyens à mettre en oeuvre pour leur acquisition automatique.<br /> <br /> Cette étude a été réalisée dans le cadre d&#039;un projet TCAN (Traitement des connaissances et NTIC) du CNRS, sur la Découverte et l&#039;exploration des corpus comparables pour l&#039;accés à l&#039;information multilingue (DECO), débuté en 2004.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1800" hreflang="fr">recherche d&#039;information</a></div> <div class="field__item"><a href="/taxonomy/term/1801" hreflang="fr">genre textuel</a></div> <div class="field__item"><a href="/taxonomy/term/1802" hreflang="fr">discours</a></div> <div class="field__item"><a href="/taxonomy/term/1803" hreflang="fr">catégorisation</a></div> <div class="field__item"><a href="/taxonomy/term/1804" hreflang="fr">classification</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 84 at https://ertim.inalco.fr