indexation automatique https://ertim.inalco.fr/ fr Etude sur l’indexation automatique de documents dans un contexte de recherche d’information à caractère sensible https://ertim.inalco.fr/node/159 <span class="field field--name-title field--type-string field--label-hidden">Etude sur l’indexation automatique de documents dans un contexte de recherche d’information à caractère sensible</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2003</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L’accroissement incessant des documents pouvant être accessibles aux utilisateurs rend les techniques de Recherche Documentaire (RD) toujours plus perfectibles et souvent exigeantes en ressources linguistiques et en traitements spécifiques. Par ailleurs, il est couramment admis que les outils de TAL pour la Recherche Documentaire requièrent de vastes connaissances linguistiques.<br /> <br /> Nous étudierons en première partie, les techniques et méthodes actuelles souvent utilisées dans le domaine de la recherche d’information. Dans une deuxième partie, nous tenterons de montrer l’intérêt d’une lemmatisation tout en discutant les avantages et les inconvénients d’une telle méthode à travers différentes langues indo‑européennes et non indo‑européennes.<br /> <br /> Enfin, dans une troisième et dernière partie nous dégagerons les méthodes adaptées à la spécificité du travail de la DST, où nous avons effectué notre stage. Nous présenterons dans une étude de faisabilité, l’enrichissement de l’indexeur Mnogosearch grâce à l’optimisation de la pertinence des requêtes et la recherche d’améliorations linguistiques. Ainsi, nous analyserons les performances linguistiques relevant de la technique de lemmatisation appliquée à un modèle statistique, compte tenu du caractère sensible des documents. Cette étude nous mènera à construire un prototype simple illustrant la méthode choisie.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2125" hreflang="fr">indexation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/1832" hreflang="fr">recherche d’information</a></div> <div class="field__item"><a href="/taxonomy/term/2126" hreflang="fr">recherche documentaire</a></div> <div class="field__item"><a href="/taxonomy/term/2127" hreflang="fr">extension de requêtes</a></div> <div class="field__item"><a href="/taxonomy/term/2128" hreflang="fr">Mnogosearch</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 159 at https://ertim.inalco.fr