perplexité https://ertim.inalco.fr/ fr Adaptation des systèmes de traduction automatique neuronale aux domaines spécialisés https://ertim.inalco.fr/node/624 <span class="field field--name-title field--type-string field--label-hidden">Adaptation des systèmes de traduction automatique neuronale aux domaines spécialisés </span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Yunbei Zhang</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2018</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La traduction automatique neuronale est une technique émergente dans la discipline de linguistique informatique. L’entraînement du modèle de traduction neuronale est basé sur un corpus parallèle. Traduire des textes d’un domaine non représenté dans le corpus d’entraînement s’avère difficile et produit une qualité de traduction peu satisfaisante. Ce travail de recherche a été effectué à l’aide du système de traduction automatique neuronale implémenté par Systran. Il s’agit d’entraîner des modèles de traduction français-chinois à travers un processus de spécialisation en fine-tuning, et également des modèles de classification automatique de texte. Nous avons investigué une méthode hybride qui consiste à calculer pour chaque phrase du document à traduire, la probabilité qu’elle appartienne à chaque classe prédéfinie. La probabilité sera considérée comme un poids sur le score de confiance assigné sur chaque phrase de traduction générée par le système de traduction, et la traduction recueillant un meilleur score pondéré sera sélectionnée et réécrite dans un nouveau fichier de sortie. La traduction sera accumulée phrase par phrase dans ce fichier de sortie en construisant une traduction synthétique. La tâche de classification automatique de texte a été réalisée avec l&#039;algorithme de Ngramme et Naïve Bayes qui nous permettent d’avoir une meilleure F-mesure (100%). L’adaptation du système de traduction aux domaines spécialisés améliore le score BLEU.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2507" hreflang="fr">adaptation des domaines</a></div> <div class="field__item"><a href="/taxonomy/term/2508" hreflang="fr">traduction automatique neuronale</a></div> <div class="field__item"><a href="/taxonomy/term/2428" hreflang="fr">méthode hybride</a></div> <div class="field__item"><a href="/taxonomy/term/2509" hreflang="fr">classification multi-classe</a></div> <div class="field__item"><a href="/taxonomy/term/2510" hreflang="fr">ngramme</a></div> <div class="field__item"><a href="/taxonomy/term/2511" hreflang="fr">naïve bayes</a></div> <div class="field__item"><a href="/taxonomy/term/2512" hreflang="fr">perplexité</a></div> <div class="field__item"><a href="/taxonomy/term/2513" hreflang="fr">valeur pondérée</a></div> <div class="field__item"><a href="/taxonomy/term/2514" hreflang="fr">traduction synthétique</a></div> <div class="field__item"><a href="/taxonomy/term/2515" hreflang="fr">f-mesure</a></div> <div class="field__item"><a href="/taxonomy/term/2516" hreflang="fr">bleu</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoire-YunbeiZHANG.pdf" type="application/pdf">memoire-YunbeiZHANG.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 624 at https://ertim.inalco.fr