japonais https://ertim.inalco.fr/ fr Evaluation d'un etiqueteur du japonais dans le domaine economique pour l'extraction d'entites nommees "organisation" https://ertim.inalco.fr/node/454 <span class="field field--name-title field--type-string field--label-hidden">Evaluation d&#039;un etiqueteur du japonais dans le domaine economique pour l&#039;extraction d&#039;entites nommees &quot;organisation&quot;</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Emilie Taniyama</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2009</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/2226" hreflang="fr">étiqueteur</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/2227" hreflang="fr">extraction d&#039;informations</a></div> <div class="field__item"><a href="/taxonomy/term/1799" hreflang="fr">évaluation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 454 at https://ertim.inalco.fr Analyse des problèmes posés par le Japonais dans un contexte de recherche d’informations https://ertim.inalco.fr/node/139 <span class="field field--name-title field--type-string field--label-hidden">Analyse des problèmes posés par le Japonais dans un contexte de recherche d’informations</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le moteur de recherche Google s’est imposé ces dernières années comme l’outil de recherche d’information le plus performant pour le grand public. Ce mémoire propose de tester la version japonaise du moteur et d’en analyser les faiblesses. Nous nous pencherons tout d’abord sur les problèmes que pose la pluralité des écritures : en quoi l’utilisateur peut il passer à côté de résultats pertinents en effectuant des requêtes dans une langue où jusqu’à 4 graphies différentes peuvent être utilisées dans un même corpus ? Vient alors la question de la segmentation en Japonais : comment le moteur réagit il face à une langue où les espaces n’existent pas ? Enfin, notre travail se terminera par une étude des ambiguïtés phonétiques et lexicales propres à la langue de Mishima : comment peut on améliorer le traitement des néologismes et des transcription phonétiques à partir d’autres langues ? Après avoir effectué plusieurs tests sur le moteur, nous analyserons les problèmes pour finalement proposer des méthodes et solution permettant d’améliorer la pertinence des résultats.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/1758" hreflang="fr">moteur de recherche</a></div> <div class="field__item"><a href="/taxonomy/term/1965" hreflang="fr">ambiguïté</a></div> <div class="field__item"><a href="/taxonomy/term/1839" hreflang="fr">segmentation</a></div> <div class="field__item"><a href="/taxonomy/term/2033" hreflang="fr">néologisme</a></div> <div class="field__item"><a href="/taxonomy/term/1848" hreflang="fr">pertinence</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 139 at https://ertim.inalco.fr Outils d'extraction et d'alignement terminologiques franco-japonais https://ertim.inalco.fr/node/134 <span class="field field--name-title field--type-string field--label-hidden">Outils d&#039;extraction et d&#039;alignement terminologiques franco-japonais</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire propose une méthode pour constituer des ressources lexicales type glossaire, lexique etc. bilingues japonais français. Dans ce but, un outil d’extraction terminologique pour le japonais, ACABIT, y sera présenté et testé. Sur la base des termes extraits à partir d’un corpus à l’origine bilingue et ensuite alignés, nous avons pu élaborer des unités de traduction qui peuvent servir de base à la construction de ressources lexicales bilingues. Ce mémoire apporte également une évaluation et une critique des outils et logiciels étudiés et de la méthode envisagée.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1820" hreflang="fr">extraction</a></div> <div class="field__item"><a href="/taxonomy/term/2011" hreflang="fr">candidats termes</a></div> <div class="field__item"><a href="/taxonomy/term/2012" hreflang="fr">ACABIT</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/2013" hreflang="fr">français</a></div> <div class="field__item"><a href="/taxonomy/term/2014" hreflang="fr">ressources lexicales</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2015" hreflang="fr">unités de traduction</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 134 at https://ertim.inalco.fr EJE : Outil d’extraction d’entités nommées en japonais à partir de textes alignés japonais-langue2 https://ertim.inalco.fr/node/111 <span class="field field--name-title field--type-string field--label-hidden">EJE : Outil d’extraction d’entités nommées en japonais à partir de textes alignés japonais-langue2</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Guillaume</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2007</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le but de ce projet était d&#039;automatiser l’extraction d’entités nommées en japonais afin de faciliter leur reconnaissance dans une autre langue et ce, dans le cadre d’un alignement textuel.L&#039;outil créé prend donc en entrée un couple de textes alignés japonais-langue2 et effectue l&#039;extraction des entités en japonais. L&#039;utilisation de l&#039;unicode pour les traitements et l&#039;affichage autorise l&#039;utilisateur à choisir en langue2 la langue de son choix.Un affichage sous forme de tableau html permet ensuite à l&#039;utilisateur de visualiser les phrases japonaises contenant ces entités surlignées ainsi que les phrases équivalentes dans la deuxième langue.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/1820" hreflang="fr">extraction</a></div> <div class="field__item"><a href="/taxonomy/term/1910" hreflang="fr">textes alignés</a></div> <div class="field__item"><a href="/taxonomy/term/1911" hreflang="fr">EJE</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 111 at https://ertim.inalco.fr Exploitation de critéres de distinction automatique des textes scientifiques et vulgarisés autour des notions "diabéte / régime alimentaire" https://ertim.inalco.fr/node/80 <span class="field field--name-title field--type-string field--label-hidden">Exploitation de critéres de distinction automatique des textes scientifiques et vulgarisés autour des notions &quot;diabéte / régime alimentaire&quot;</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Tomimitsu</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Aprés avoir constitué deux corpus japonais (scientifique et vulgarisé) dans le cadre du projet DECO, diverses analyses ont été effectuées sur ces corpus pour en dégager des critéres de la distinction automatique des textes scientifiques et vulgarisés.<br /> <br /> Des critéres proposés par des études précédentes comme quelques critéres originaux (dont celui de la mise en rapport des styles &quot;neutre / poli&quot; avec les catégories &quot;scientifique / vulgarisé&quot;) ont été examinés et exploités.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1782" hreflang="fr">corpus comparables</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/1784" hreflang="fr">distinction automatique</a></div> <div class="field__item"><a href="/taxonomy/term/1785" hreflang="fr">genres discursifs</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 80 at https://ertim.inalco.fr