méthodologie https://ertim.inalco.fr/ fr Développement d'une maquette de traduction automatique khmer-français comme modèle pour des langues peu dotées https://ertim.inalco.fr/node/570 <span class="field field--name-title field--type-string field--label-hidden">Développement d&#039;une maquette de traduction automatique khmer-français comme modèle pour des langues peu dotées</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2014</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Cette étude vise à définir une méthodologie pour la création de systèmes de traduction automatique pour les langues peu dotées. Les systèmes de traduction automatique à base de statistiques ont permis des progrès considérables, mais sont peu adaptés aux langues peu dotées pour lesquelles il n&#039;existe que peu de données. C&#039;est pourquoi nous avons choisi un système à règle (Ariane-H), issu du GETA (laboratoire pionnier en traduction automatique en France). Pour la méthodologie, nous avons décidé de prendre un corpus exemple, qui sera Le Petit Prince d&#039;Antoine de Saint-Exupéry, qui a l&#039;avantage d&#039;être traduit dans 270 langues. Dans un premier temps, nous avons créé une maquette khmer-français. Nous nous sommes servis des difficultés rencontrées pour définir la marche à suivre pour d&#039;autres langues, et les phénomènes linguistiques traités serviront d&#039;exemples. Nous avons ensuite mis ces travaux à l&#039;épreuve, en démarrant la création de systèmes pour d&#039;autres langues.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/875" hreflang="fr">traduction automatique</a></div> <div class="field__item"><a href="/taxonomy/term/887" hreflang="fr">langues peu dotées</a></div> <div class="field__item"><a href="/taxonomy/term/1839" hreflang="fr">segmentation</a></div> <div class="field__item"><a href="/taxonomy/term/1979" hreflang="fr">méthodologie</a></div> <div class="field__item"><a href="/taxonomy/term/2320" hreflang="fr">khmer</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/Memoire_G_DE_MALEZIEUX.pdf" type="application/pdf">Memoire_G_DE_MALEZIEUX.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 570 at https://ertim.inalco.fr Les méthodes et les spécificités de l’indexation de la presse écrite et de la vidéo pour la télévision ( étude du cas de la chaîne de l’information TF1) https://ertim.inalco.fr/node/127 <span class="field field--name-title field--type-string field--label-hidden">Les méthodes et les spécificités de l’indexation de la presse écrite et de la vidéo pour la télévision ( étude du cas de la chaîne de l’information TF1)</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La Gestion de l’Information dans le domaine des média audiovisuels est le pilier de la fabrication du Journal Télévisé. Dans la chaîne documentaire (de l’étape de l’acquisition de l’information jusqu’à sa recherche par les journalistes) il y a différents systèmes qui doivent fonctionner de façon cohérente et homogène. Pour d’avantage de performances du fonctionnement de la chaîne documentaire, les méthodes et les spécificités d’indexation doivent être en harmonie et en correspondance avec les outils de traitement de fiches et de recherche dans la base de données. L’objectif de notre étude est d’analyser la méthodologie d’indexation des documents textuels et vidéo, de détecter les failles dans la chaîne et/ou d’établire les incohérences, et par la suite de faire des propositions d’améliorations en application à la recherche.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1975" hreflang="fr">GED (Gestion électronique des documents)</a></div> <div class="field__item"><a href="/taxonomy/term/1976" hreflang="fr">chaîne documentaire</a></div> <div class="field__item"><a href="/taxonomy/term/1759" hreflang="fr">information</a></div> <div class="field__item"><a href="/taxonomy/term/1977" hreflang="fr">document</a></div> <div class="field__item"><a href="/taxonomy/term/1978" hreflang="fr">catalogage</a></div> <div class="field__item"><a href="/taxonomy/term/1827" hreflang="fr">indexation</a></div> <div class="field__item"><a href="/taxonomy/term/1979" hreflang="fr">méthodologie</a></div> <div class="field__item"><a href="/taxonomy/term/1980" hreflang="fr">mot clé</a></div> <div class="field__item"><a href="/taxonomy/term/1798" hreflang="fr">recherche</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 127 at https://ertim.inalco.fr