tokenisation https://ertim.inalco.fr/ fr Quelques axes méthodologiques pour le développement d'un outil de recherche https://ertim.inalco.fr/node/90 <span class="field field--name-title field--type-string field--label-hidden">Quelques axes méthodologiques pour le développement d&#039;un outil de recherche</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Lam</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2006</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La recherche d&#039;informations opérant sur des données privées constitue un besoin important dans de multiples domaines. Elle est particulièrement utile pour les organisations ou les entreprises qui souhaitent exploiter une base de connaissances. Si l&#039;on souhaite disposer de services comparables à ceux proposés par les moteurs que l&#039;on utilise pour faire des recherches sur le Web, le contrôle des différents processus impliqués dans la mise en œuvre (&quot;page ranking&quot;, stratégie d&#039;indexation, méthodes de recherche, etc..) garantit que les spécificités de l&#039;organisation et du corpus seront effectivement prises en compte. Nous proposons ici de faire l&#039;inventaire des différentes problématiques impliquées dans la mise en oeuvre d&#039;un moteur de recherche au sein d&#039;une organisation souhaitant exploiter un corpus de données spécifiques. Nous étudions en outre comment cette mise en œuvre peut se faire à partir de solutions Open source, celles ci proposant à la fois le matériel adéquat et le niveau de qualité requis pour mener à bien ce type de projet. Cet inventaire est abordé sous deux aspects. Le premier concerne les phénomènes linguistiques à traiter, le second, le cadre dans lequel on peut effectivement les mettre en œuvre, c&#039;est à dire à la fois les programmer, les faire évoluer et en assurer une exploitation efficace.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1827" hreflang="fr">indexation</a></div> <div class="field__item"><a href="/taxonomy/term/1828" hreflang="fr">page-ranking</a></div> <div class="field__item"><a href="/taxonomy/term/1829" hreflang="fr">sac de mot</a></div> <div class="field__item"><a href="/taxonomy/term/1830" hreflang="fr">OpenSource</a></div> <div class="field__item"><a href="/taxonomy/term/1831" hreflang="fr">tokenisation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 90 at https://ertim.inalco.fr