métriques d’évaluation https://ertim.inalco.fr/ fr Segmentation thématique de transcriptions automatiques de données audiovisuelle https://ertim.inalco.fr/node/734 <span class="field field--name-title field--type-string field--label-hidden">Segmentation thématique de transcriptions automatiques de données audiovisuelle</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">lun 09/10/2023 - 16:38</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Lufei LIU</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2022</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Structurer les données audiovisuelles est un travail important au vu de la quantité croissante de celles-ci. L’une des solutions est de les classer en fonction des thèmes abordés, un travail qui pourrait être réalisé, voire automatisé, à travers les techniques de la segmentation thématique automatiques. Segmenter un document en thèmes permet aux utilisateurs d’avoir une idée générale des thèmes traités, et ainsi de cibler plus facilement les informations qui les intéressent. Ce mémoire a pour objectif de comparer plusieurs méthodes de segmentation thématique et d’analyser leur applicabilité pour les transcriptions automatiques de données audiovisuelles. Nous présenterons le fonctionnement des méthodes choisies et les spécificités des données transcrites. Par la suite, nous évaluerons ces méthodes en empruntant un métrique que nous estimons plus objectif pour la tâche.<br /> </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2603" hreflang="fr">segmentation thématique automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2604" hreflang="fr">transcription automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2605" hreflang="fr">thème</a></div> <div class="field__item"><a href="/taxonomy/term/2606" hreflang="fr">cohésion lexicale</a></div> <div class="field__item"><a href="/taxonomy/term/2550" hreflang="fr">métriques d’évaluation</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/LIU.pdf" type="application/pdf">LIU.pdf</a></span> </div> </div> Mon, 09 Oct 2023 14:38:48 +0000 gestionnaire 734 at https://ertim.inalco.fr Intégration des technologies de traduction automatique neuronale à l'échelle d'une agence de traduction https://ertim.inalco.fr/node/634 <span class="field field--name-title field--type-string field--label-hidden">Intégration des technologies de traduction automatique neuronale à l&#039;échelle d&#039;une agence de traduction</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Victorien Villiers</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2019</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le présent mémoire compile deux études menées au sein de l’agence de traduction Univoice, en lien avec la traduction automatique neuronale. Dans la première, nous évaluons les traductions produites par différents outils de traduction automatique neuronale disponibles sur le marché pour la paire de langue anglais-français, dans le cadre de la sélection d’un fournisseur tiers. Nous nous aidons pour cela de deux métriques humaines, inspirées du standard MQM-DQF, et de la métrique automatique BLEU. Dans la seconde étude, nous évaluons la viabilité du développement de moteurs de traduction automatique neuronale en interne, à l’aide de la technologie OpenNMT et de corpus multilingues alignés open-source. Nous mettons en place une série de scripts permettant l’extraction de textes alignés à partir de mémoires de traduction au format TMX et l’entraînement de modèles basés sur la technologie des réseaux de neurones récurrents LSTM, et évaluons les résultats obtenus sur un échantillon de traductions générées en sortie.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2549" hreflang="fr">marché de la traduction</a></div> <div class="field__item"><a href="/taxonomy/term/2508" hreflang="fr">traduction automatique neuronale</a></div> <div class="field__item"><a href="/taxonomy/term/2550" hreflang="fr">métriques d’évaluation</a></div> <div class="field__item"><a href="/taxonomy/term/2551" hreflang="fr">mqm-dqf</a></div> <div class="field__item"><a href="/taxonomy/term/2552" hreflang="fr">opennmt</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/VILLIERS_Victorien_2019.pdf" type="application/pdf">VILLIERS_Victorien_2019.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 634 at https://ertim.inalco.fr