entités nommées https://ertim.inalco.fr/ fr L’analyse textuelle de corpus de discours écologiques relatifs au smog épais en Chine au moyen d’outils informatiques de text mining https://ertim.inalco.fr/node/588 <span class="field field--name-title field--type-string field--label-hidden">L’analyse textuelle de corpus de discours écologiques relatifs au smog épais en Chine au moyen d’outils informatiques de text mining</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2015</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La dégradation de l’environnement surtout celle atmosphérique, qui résulte du développement industriel rapide de Chine, suscite l’attention générale de la société chinoise. Du fait que cette pollution de l’air est au détriment de tous les côtés de la vie quotidienne, et qu’elle affecte une zone très étendue en Chine, toute la société y prête leur attention, du milieu gouvernemental au peuple chinois. Dès lors, l’expression «雾wù霾 maí»(le brouillard de pollution) est devenu un mot-clé qui apparaît fréquemment sur les sites web de types divers. On discute de l’origine du smog épais en Chine à ses nocivités de cet air polluant sur la santé humaine et sur différents aspects de la vie courante. Ayant pour objectif de comparer et d’extraire les attitudes et les réactions différentes du gouvernement chinois et du grand public, à l’aide des outils informatiques, notre recherche vise à recueillir d’abord en grande quantité les textes publiés sur deux types de sites web chinois [1]: institutionnel et médiatique, puis catégoriser les textes en fonction de leur nature [2] et subdiviser ces textes encore à l’intérieur de chaque catégorie : les sous-type selon les rubriques que les textes subordonnent. Dans un second temps, à partir du corpus classé et basé sur le wù maí comme mot-clé, on analyse et compare entre les sous-corpus et entre les sous-types homogènes, les deux types de discours au niveau de la fréquence, de la cooccurrence et de la concordance du mot-clé. Quant à la conclusion, les caractéristiques manifestées par les trois sous-corpus montrent les différences des attitudes et des réactions du milieu gouvernemental et du grand public en Chine : le gouvernement met l’accent sur ses actions et mesures prises sur le problème wù maí, alors que le peuple chinois s’intéresse plutôt « D’où vient le smog épais ? » « Quelles sont les nocivités liées au smog épais dans la vie courante ? » « Comment se protéger contre le brouillard quotidiennement ? ». </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2381" hreflang="fr">détection de thème</a></div> <div class="field__item"><a href="/taxonomy/term/2382" hreflang="fr">visualisation thématique</a></div> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/1832" hreflang="fr">recherche d’information</a></div> <div class="field__item"><a href="/taxonomy/term/2383" hreflang="fr">visualisation de données</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/Me%CC%81moire%20DANG%20Qinran.pdf" type="application/pdf">Mémoire DANG Qinran.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 588 at https://ertim.inalco.fr Filtrage sémantique et visualisation de données textuelles https://ertim.inalco.fr/node/587 <span class="field field--name-title field--type-string field--label-hidden">Filtrage sémantique et visualisation de données textuelles</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2015</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail porte sur la question de la visualisation thématique en recherche d’informations. Dans un contexte de plus en plus prégnant de circulation d’informations et face à d’importants flux de données il convient de synthétiser l’information. A plus forte raison garantir un accès rapide et pertinent à l’information peut devenir délicat lorsque c’est un utilisateur qui définit le thème recherché. Nous proposons une approche par croisement de thèmes &quot;simples&quot; pour définir une thématique &quot;complexe&quot;. Nous abordons ensuite un système d’enrichissement thématique basé sur des coefficients de similarité. Enfin nous traitons de la visualisation de données en nous appuyant sur les entités nommées contenues dans la thématique détectée . On considérera ici qu’un utilisateur peut obtenir une réponse à une information recherchée grâce à la synthèse visuelle d’entités nommées issues de la détection de thème.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2381" hreflang="fr">détection de thème</a></div> <div class="field__item"><a href="/taxonomy/term/2382" hreflang="fr">visualisation thématique</a></div> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/1832" hreflang="fr">recherche d’information</a></div> <div class="field__item"><a href="/taxonomy/term/2383" hreflang="fr">visualisation de données</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/FerguthJohanMemoire_M2_TAL_IM_2015.pdf" type="application/pdf">FerguthJohanMemoire_M2_TAL_IM_2015.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 587 at https://ertim.inalco.fr Evaluation d'un etiqueteur du japonais dans le domaine economique pour l'extraction d'entites nommees "organisation" https://ertim.inalco.fr/node/454 <span class="field field--name-title field--type-string field--label-hidden">Evaluation d&#039;un etiqueteur du japonais dans le domaine economique pour l&#039;extraction d&#039;entites nommees &quot;organisation&quot;</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Emilie Taniyama</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2009</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/2226" hreflang="fr">étiqueteur</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/2227" hreflang="fr">extraction d&#039;informations</a></div> <div class="field__item"><a href="/taxonomy/term/1799" hreflang="fr">évaluation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 454 at https://ertim.inalco.fr Identification des entités nommées dans un corpus français-anglais-arabe https://ertim.inalco.fr/node/167 <span class="field field--name-title field--type-string field--label-hidden">Identification des entités nommées dans un corpus français-anglais-arabe</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Avec la montée en puissance des réseaux (Internet notamment), la taille des documents multilingues à traiter devient de plus en plus importante, ce qui augmente les besoins en outils de traitement automatique pour différentes langues. Parmi ces outils, beaucoup ont recours à la reconnaissance et l&#039;extraction automatique des entités nommées : indexation automatique de documents, recherche d&#039;information, traduction automatique, catégorisation, etc. Notre travail de stage consiste à repérer les entités nommées dans un corpus trilingue Anglais/Arabe/Français (non aligné) collecté à partir des ressources disponibles sur Internet. Dans notre mémoire, nous commencerons d&#039;abord par la présentation d&#039;un état de l&#039;art pour passer en revue les récents systèmes développés pour la reconnaissance des entités nommées pour le Français et l&#039;Anglais ayant notamment participé aux conférences MUC. Nous tenterons ensuite d&#039;examiner ce qui a été fait pour le traitement automatique de l&#039;Arabe et, si possible, ceux concernant l&#039;extraction des entités nommées. Nous ferons ensuite le lien avec le travail réalisé durant notre stage et aborderons les difficultés rencontrées et les solutions mises en place pour les résoudre. </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/2149" hreflang="fr">reconnaissance automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2150" hreflang="fr">anglais</a></div> <div class="field__item"><a href="/taxonomy/term/2113" hreflang="fr">arabe</a></div> <div class="field__item"><a href="/taxonomy/term/2013" hreflang="fr">français</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 167 at https://ertim.inalco.fr EJE : Outil d’extraction d’entités nommées en japonais à partir de textes alignés japonais-langue2 https://ertim.inalco.fr/node/111 <span class="field field--name-title field--type-string field--label-hidden">EJE : Outil d’extraction d’entités nommées en japonais à partir de textes alignés japonais-langue2</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Guillaume</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2007</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le but de ce projet était d&#039;automatiser l’extraction d’entités nommées en japonais afin de faciliter leur reconnaissance dans une autre langue et ce, dans le cadre d’un alignement textuel.L&#039;outil créé prend donc en entrée un couple de textes alignés japonais-langue2 et effectue l&#039;extraction des entités en japonais. L&#039;utilisation de l&#039;unicode pour les traitements et l&#039;affichage autorise l&#039;utilisateur à choisir en langue2 la langue de son choix.Un affichage sous forme de tableau html permet ensuite à l&#039;utilisateur de visualiser les phrases japonaises contenant ces entités surlignées ainsi que les phrases équivalentes dans la deuxième langue.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> <div class="field__item"><a href="/taxonomy/term/1783" hreflang="fr">japonais</a></div> <div class="field__item"><a href="/taxonomy/term/1820" hreflang="fr">extraction</a></div> <div class="field__item"><a href="/taxonomy/term/1910" hreflang="fr">textes alignés</a></div> <div class="field__item"><a href="/taxonomy/term/1911" hreflang="fr">EJE</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 111 at https://ertim.inalco.fr Pistes méthodologiques pour l'acquisition de noms de personnes à partir du WEB https://ertim.inalco.fr/node/85 <span class="field field--name-title field--type-string field--label-hidden">Pistes méthodologiques pour l&#039;acquisition de noms de personnes à partir du WEB</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Chevrier</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2005</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L&#039;acquisition de noms de personnes peut être nécessaire pour des applications en ingénierie linguistique.<br /> <br /> Nous avons constitué un lexique de noms de famille de personnes norvégiennes pour un système de reconnaissance d&#039;écriture à l&#039;aide d&#039;une méthode simple qui nous semble manquer de robustesse. Pour essayer de trouver des méthodes alternatives, nous avons étudié la tâche de reconnaissance des entités nommées et les systémes dédiés à celle-ci, ainsi que quelques méthodes d&#039;acquisition d&#039;entités nommées à partir du WEB.<br /> <br /> Nous en avons tiré un certain nombre de pistes éventuellement exploitables pour constituer des listes de noms de famille de personnes habitant un pays donné.Ces derniéres sont : l&#039;utilisation de dictionnaires de prénoms, de listes de mots déclencheurs, d&#039;informations de capitalisation et d&#039;informations de formatage des documents HTML.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1805" hreflang="fr">acquisition de noms de personnes</a></div> <div class="field__item"><a href="/taxonomy/term/1806" hreflang="fr">reconnaissance de noms propres</a></div> <div class="field__item"><a href="/taxonomy/term/1807" hreflang="fr">web</a></div> <div class="field__item"><a href="/taxonomy/term/1808" hreflang="fr">entités nommées</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 85 at https://ertim.inalco.fr