évaluation humaine https://ertim.inalco.fr/ fr Système de traduction automatique neuronale français-mongol Historique, technologies, mise en place et évaluations https://ertim.inalco.fr/node/743 <span class="field field--name-title field--type-string field--label-hidden">Système de traduction automatique neuronale français-mongol Historique, technologies, mise en place et évaluations</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 10/10/2023 - 16:03</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Shuai GAO</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2021</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">De nos jours, la traduction automatique (MT) est de plus en plus utilisée, surtout la traduction automatique neuronale, qui a porté la qualité des traductions à un nouveau niveau. Malgré son développement rapide, elle ne fonctionne de manière suffisante que pour des langues principales telles que l’anglais, le français, le chinois et l’espagnol, etc. En ce qui concerne les langues moins parlées ou minoritaires, il n’existe pas beaucoup de recherches sur la MT. Notamment, dans le cas de notre mémoire, pour la paire de langues français-mongol, il n’existe aucune recherche publiée dessus. Ce mémoire consiste à retracer le travail que nous avons effectué pour la mise en place d’un système de traduction automatique neuronale (NMT) pour la paire de langues français-mongol. Notre intérêt réside en premier lieu dans la traduction automatique en nous intéressant à son développement et aux dernières technologies. Deuxièmement, nous nous pencherons sur la langue mongole en présentant ses caractéristiques ainsi que les travaux précédents liés à la MT. Ensuite, nous nous emploierons à entraîner, à partir d’un corpus parallèle open-source, des modèles de NMT français-mongol avec l’outil OpenNMT. Finalement, nous effectuerons deux évaluations automatiques et proposerons une méthode d’évaluation humaine, nommée «IFF », ce qui permet de connaître les forces et les faiblesses de notre système par rapport à des moteurs de traduction à usage commercial. Ce travail entend revitaliser la langue mongole et protéger la diversité de notre ADN culturel en établissant des liens avec d’autres langues principales à l’appui de la NMT.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2508" hreflang="fr">traduction automatique neuronale</a></div> <div class="field__item"><a href="/taxonomy/term/2635" hreflang="fr">langue mongole</a></div> <div class="field__item"><a href="/taxonomy/term/2636" hreflang="fr">évaluation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2523" hreflang="fr">évaluation humaine</a></div> <div class="field__item"><a href="/taxonomy/term/2637" hreflang="fr">score bleu</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/GAO_Shuai.pdf" type="application/pdf">GAO_Shuai.pdf</a></span> </div> </div> Tue, 10 Oct 2023 14:03:09 +0000 gestionnaire 743 at https://ertim.inalco.fr Évaluation de la qualité de la TAN français-chinois fondée sur une typologie des erreurs : le cas de la traduction littéraire https://ertim.inalco.fr/node/739 <span class="field field--name-title field--type-string field--label-hidden">Évaluation de la qualité de la TAN français-chinois fondée sur une typologie des erreurs : le cas de la traduction littéraire</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 10/10/2023 - 15:14</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Xinyi ZHONG</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2022</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La naissance de la technologie des réseaux neuronaux permet non seulement de rendre plus rapide la traduction automatique (noté TA ci-dessous), mais aussi d’en améliorer la qualité. Néanmoins, la TA souffre encore de nombreuses erreurs qui varient largement d’une paire de langues à l’autre. Pour les paires de langues qui ne sont pas apparentées (par exemple, français-chinois), la qualité de la TA souffre encore de tares importantes. L’analyse des erreurs est donc nécessaire, que ce soit pour sensibiliser les utilisateurs aux imperfections de la TA ou pour tenter d’affiner cette technologie. De ce fait, l’évaluation de la qualité et l’analyse des erreurs de traduction automatique restent des sujets de recherche importants dans le domaine du traitement automatique des langues. Dans le contexte de démocratisation des moteurs de traduction automatique neuronale et d’attention croissante accordée à l’analyse des erreurs, nous explorerons les manières de développer une typologie d’erreurs pour la TA du français vers le chinois et les modalités de construction d’un corpus parallèle d’annotations d’erreurs. Nous nous intéresserons dans un premier temps à l’histoire de la traduction automatique, aux différentes méthodes d’évaluation de la qualité de la traduction automatique, aux types d’erreurs ainsi qu’à l’annotation d’erreurs. Ensuite, nous présentons des expériences qui comprennent la préparation de jeux de donnée, l’application des pré-traitements et l’annotation des erreurs. Finalement, nous effectuerons une analyse quantitative fondée sur des statistiques des erreurs d’adéquation et de fluidité annotées. Nous discutons également des résultats sur des causes des erreurs et des difficultés d’annotation pour une analyse qualitative.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2523" hreflang="fr">évaluation humaine</a></div> <div class="field__item"><a href="/taxonomy/term/2508" hreflang="fr">traduction automatique neuronale</a></div> <div class="field__item"><a href="/taxonomy/term/2627" hreflang="fr">typologie d&#039;erreurs</a></div> <div class="field__item"><a href="/taxonomy/term/2628" hreflang="fr">langue chinoise</a></div> <div class="field__item"><a href="/taxonomy/term/2629" hreflang="fr">annotation des erreurs de traduction</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/ZHONG_Xinyi.pdf" type="application/pdf">ZHONG_Xinyi.pdf</a></span> </div> </div> Tue, 10 Oct 2023 13:14:25 +0000 gestionnaire 739 at https://ertim.inalco.fr Comparaison de systèmes de génération automatisée de textes https://ertim.inalco.fr/node/715 <span class="field field--name-title field--type-string field--label-hidden">Comparaison de systèmes de génération automatisée de textes</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 02/02/2021 - 11:46</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Maëva Leproux</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2020</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire décrit la procédure d&#039;un projet de génération de textes automatisée avec deux systèmes différents. Nous avons mis en place un corpus de modèles, de données d&#039;entrée, rédigé les règles prises en compte dans le projet et programmé un système à base de réseau neuronal. Les deux systèmes doivent générer des textes à partir de données immobilières sur des villes et leur département. Ces textes doivent être compréhensibles et factuels, dans un but informatif. Nous comparerons les résultats obtenus par les deux systèmes de génération automatique de texte, ainsi que les notations obtenues pendant leur évaluation humaine. Nous détaillerons ainsi les spécificités des systèmes, ainsi que les avantages et inconvénients de chacun.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2474" hreflang="fr">génération automatique de textes</a></div> <div class="field__item"><a href="/taxonomy/term/2523" hreflang="fr">évaluation humaine</a></div> <div class="field__item"><a href="/taxonomy/term/2658" hreflang="fr">système de génération automatique de texte à base de modèles</a></div> <div class="field__item"><a href="/taxonomy/term/2659" hreflang="fr">système de génération automatique de texte à base de réseau neuronal</a></div> <div class="field__item"><a href="/taxonomy/term/2660" hreflang="fr">textes immobiliers</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/LEPROUX_Maeva_memoire2020_corrige_0.pdf" type="application/pdf">LEPROUX_Maeva_memoire2020_corrige_0.pdf</a></span> </div> </div> Tue, 02 Feb 2021 10:46:35 +0000 gestionnaire 715 at https://ertim.inalco.fr Génération automatique de rapports d’analyse financière. Développement et évaluation d’un système à base de règles https://ertim.inalco.fr/node/626 <span class="field field--name-title field--type-string field--label-hidden">Génération automatique de rapports d’analyse financière. Développement et évaluation d’un système à base de règles</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Milena Chaine</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2019</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire décrit le développement et l&#039;évaluation d&#039;un système de génération automatique de rapports d&#039;analyse financière. Nous avons défini, modélisé et codé des règles de génération pour un système commercial permettant de générer régulièrement plusieurs centaines de rapports simplifiés d&#039;analyse. Le système doit modéliser des données informatiques non-textuelles complexes afin de les utiliser dans des règles de génération définies en collaboration avec des analystes financiers. Ces règles doivent être représentatives de l&#039;expertise d&#039;un·e analyste et permettre de générer un texte cohérent d&#039;un point de vue rhétorique et linguistique. Enfin, les rapports d&#039;analyse générés doivent employer la langue spécialisée du domaine qu&#039;est la finance de marché. Pour évaluer la qualité des textes générés, nous avons mis en place un protocole d&#039;évaluation humaine par des spécialistes du domaine.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2474" hreflang="fr">génération automatique de textes</a></div> <div class="field__item"><a href="/taxonomy/term/2521" hreflang="fr">domaine de spécialité</a></div> <div class="field__item"><a href="/taxonomy/term/2522" hreflang="fr">langue de spécialité</a></div> <div class="field__item"><a href="/taxonomy/term/2457" hreflang="fr">approche symbolique</a></div> <div class="field__item"><a href="/taxonomy/term/2523" hreflang="fr">évaluation humaine</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/Chaine_Milena_MemoireTAL_corrige.pdf" type="application/pdf">Chaine_Milena_MemoireTAL_corrige.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 626 at https://ertim.inalco.fr