recherche d&#039;information https://ertim.inalco.fr/ fr Le rôle des relations sémantiques en recherche d'information : évaluation de relations sémantiques propres au domaine de la cogénération dans le cadre du projet Safir https://ertim.inalco.fr/node/183 <span class="field field--name-title field--type-string field--label-hidden">Le rôle des relations sémantiques en recherche d&#039;information : évaluation de relations sémantiques propres au domaine de la cogénération dans le cadre du projet Safir</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Dans le cadre du projet SAFIR, une terminologie du domaine de la cogénération a été constituée à partir d&#039;un corpus textuel. Elle comprend plusieurs milliers de termes et différentes relations sémantiques reliant ces termes. Cette terminologie doit servir à l&#039;enrichissement de requêtes et au filtrage des documents reçus comme éponses à ces requêtes dans une application de recherche d&#039;information (RI).L&#039;objectif de ce mémoire est de faire une évaluation des relations sémantiques de la terminologie Safir pour la recherche d&#039;information sur la cogénération. Nous avons choisi de limiter notre étude aux relations dites &quot;propres au domaine de la cogénération&quot; (autres que les relations de synonymie, hyperonymie, ingrédience, antonymie).Dans un premier temps (1), nous présentons un état de l&#039;art de la recherche sur les relations sémantiques dans le domaine de la RI. L&#039;objectif étant de présenter les différentes relations sémantiques existantes entre termes, les méthodes mises en place pour l&#039;acquisition de ces relations et de présenter des situations concrètes d&#039;utilisation de ces relations. Ensuite (2), nous présentons le projet Safir et les relations sémantiques qui structurent la terminologie et enfin (3) nous proposons une évaluation des relations propres au domaine de la cogénération pour la recherche d&#039;information et une analyse des résultats.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1800" hreflang="fr">recherche d&#039;information</a></div> <div class="field__item"><a href="/taxonomy/term/2198" hreflang="fr">relations sémantiques entre termes</a></div> <div class="field__item"><a href="/taxonomy/term/2199" hreflang="fr">structuration de terminologie</a></div> <div class="field__item"><a href="/taxonomy/term/2127" hreflang="fr">extension de requêtes</a></div> <div class="field__item"><a href="/taxonomy/term/1799" hreflang="fr">évaluation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 183 at https://ertim.inalco.fr Alignement de corpus parallèles bilingues en médecine https://ertim.inalco.fr/node/138 <span class="field field--name-title field--type-string field--label-hidden">Alignement de corpus parallèles bilingues en médecine</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le mémoire voudrait proposer une réflexion méthodologique et des outils informatiques permettant la constitution de lexiques électroniques bilingues. Une première phase du projet a trait à la méthodologie et aux techniques de collecte automatisée de corpus bilingues sur le Web. Elle explicite le choix du/des corpus sélectionnés. La constitution de lexique bilingue passe ensuite par l’alignement des couples de pages parallèles bilingues recueillies. Dans cette deuxième phase du projet, sont élaborées les différentes étapes (niveaux) de cet alignement, les techniques et les outils informatiques que l’on veut utiliser pour celles-ci. On cherchera à savoir également s’il existe un standard de codage pour ces niveaux d’alignement. L’alignement des couples de pages lui-même suppose une réflexion sur le travail de prétraitement des textes (sur la disposition formelle des textes notamment ). Une dernière phase concerne la mise au point des outils pour la collecte du lexique mis en correspondance dans les deux langues. Les correspondances observées seront comparées aux mots et termes des lexiques médicaux actuellement en cours.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2030" hreflang="fr">alignement de corpus spécialisés</a></div> <div class="field__item"><a href="/taxonomy/term/865" hreflang="fr">extraction terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2031" hreflang="fr">outils de traitement de corpus</a></div> <div class="field__item"><a href="/taxonomy/term/1800" hreflang="fr">recherche d&#039;information</a></div> <div class="field__item"><a href="/taxonomy/term/2032" hreflang="fr">bi-texte</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 138 at https://ertim.inalco.fr L’indexation automatique de ressources pédagogiques numériques : élaboration d’une méthode d’application au projet Graines de Génie – Anglais https://ertim.inalco.fr/node/112 <span class="field field--name-title field--type-string field--label-hidden">L’indexation automatique de ressources pédagogiques numériques : élaboration d’une méthode d’application au projet Graines de Génie – Anglais</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Malaret</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2007</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L&#039;indexation s&#039;inscrit dans le domaine de la documentation et plus particulièrement de la recherche d&#039;information.<br /> <br /> C&#039;est un champ trés large dans lequel l&#039;indexation manuelle a dû laisser sa place à l&#039;indexation automatique, plus rapide et économique. Pourtant, certaines difficultés inhérentes au language naturel n&#039;ont pas pu être contournées. L&#039;indexation automatique semble n&#039;être accéssible que grâce à des logiciels performants.<br /> <br /> L&#039;indexation du projet Graine de Genie propose un autre mode d&#039;accès à l&#039;indexation automatique tout en introduisant l&#039;aspect pédagogique. En effet, un index destiné à un jeune public ne tiendra pas compte des mêmes exigences qu&#039;un autre, employé par des adultes.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1912" hreflang="fr">Indexation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/1913" hreflang="fr">PHP</a></div> <div class="field__item"><a href="/taxonomy/term/1800" hreflang="fr">recherche d&#039;information</a></div> <div class="field__item"><a href="/taxonomy/term/1791" hreflang="fr">e-learning</a></div> <div class="field__item"><a href="/taxonomy/term/1914" hreflang="fr">mot-clé</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 112 at https://ertim.inalco.fr Critéres pour la catégorisation automatique des documents numériques https://ertim.inalco.fr/node/84 <span class="field field--name-title field--type-string field--label-hidden">Critéres pour la catégorisation automatique des documents numériques</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Krivine</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La recherche d&#039;information par mots-clefs, essentiellement basée sur des informations lexicales, n&#039;offre pas une caractérisation  suffisamment efficace des documents retournés.<br /> <br /> Afin d&#039;améliorer les performances des systèmes de recherche d&#039;information, l&#039;ingénierie documentaire se tourne vers une approche plus globale du texte, prenant en considération sa dimension sociolinguistique.<br /> <br /> La théorie des genres, longtemps réservée au domaine de la littérature, offre des perspectives intéressantes, car les notions de genre et de discours constituent des points d&#039;entrée vers l&#039;identification d&#039;informations pertinentes, autres que thématiques, au sein des textes.<br /> <br /> Dans ce mémoire, nous étudions la pertinence de certains de critéres linguistiques et extralinguistiques pour la caractérisation des discours scientifique et vulgarisé russe du Web et les moyens à mettre en oeuvre pour leur acquisition automatique.<br /> <br /> Cette étude a été réalisée dans le cadre d&#039;un projet TCAN (Traitement des connaissances et NTIC) du CNRS, sur la Découverte et l&#039;exploration des corpus comparables pour l&#039;accés à l&#039;information multilingue (DECO), débuté en 2004.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1800" hreflang="fr">recherche d&#039;information</a></div> <div class="field__item"><a href="/taxonomy/term/1801" hreflang="fr">genre textuel</a></div> <div class="field__item"><a href="/taxonomy/term/1802" hreflang="fr">discours</a></div> <div class="field__item"><a href="/taxonomy/term/1803" hreflang="fr">catégorisation</a></div> <div class="field__item"><a href="/taxonomy/term/1804" hreflang="fr">classification</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 84 at https://ertim.inalco.fr