Traitement Automatique des Langues https://ertim.inalco.fr/ fr Entrées de dictionnaire multilingue pour traducteurs : méthode d’automatisation https://ertim.inalco.fr/node/730 <span class="field field--name-title field--type-string field--label-hidden">Entrées de dictionnaire multilingue pour traducteurs : méthode d’automatisation</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">lun 09/10/2023 - 16:11</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Kirsten BERLAND</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2022</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La terminologie est une part importante de la traduction. Elle permet de désambiguïser, mais permet également aux traducteurs de produire un document homogène et cohérent avec le texte de la langue d’origine. Les bases de données terminologiques, dictionnaires multilingues du traducteur, sont des ressources spécialisées dans cette application. Ce mémoire propose une méthode d’automatisation d’entrées de bases terminologiques dont l’approche consiste à extraire les définitions de termes donnés ainsi que la source de ces définitions, et de construire une structure XML compatible avec une base terminologique MultiTerm à partir des données. Les langues traitées ici sont l’anglais, l’allemand et le français, cependant le programme Python qui résulte de ce mémoire peut être adapté à diverses langues et diverses bases de données.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1796" hreflang="fr">traduction</a></div> <div class="field__item"><a href="/taxonomy/term/2587" hreflang="fr">dictionnaire multilingue</a></div> <div class="field__item"><a href="/taxonomy/term/2588" hreflang="fr">sdl multiterm</a></div> <div class="field__item"><a href="/taxonomy/term/2589" hreflang="fr">définition</a></div> <div class="field__item"><a href="/taxonomy/term/2590" hreflang="fr">programmation python</a></div> <div class="field__item"><a href="/taxonomy/term/1786" hreflang="fr">base de données terminologique</a></div> <div class="field__item"><a href="/taxonomy/term/2591" hreflang="fr">beautiful soup</a></div> <div class="field__item"><a href="/taxonomy/term/1989" hreflang="fr">XML</a></div> <div class="field__item"><a href="/taxonomy/term/2009" hreflang="fr">Traitement Automatique des Langues</a></div> <div class="field__item"><a href="/taxonomy/term/2592" hreflang="fr">site internet</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/BERLAND.pdf" type="application/pdf">BERLAND.pdf</a></span> </div> </div> Mon, 09 Oct 2023 14:11:20 +0000 gestionnaire 730 at https://ertim.inalco.fr Traitement automatique de ressources textuelles pour l’indexation de l’image. Etude de cas : La collection du Musée International d’Art Naïf https://ertim.inalco.fr/node/133 <span class="field field--name-title field--type-string field--label-hidden">Traitement automatique de ressources textuelles pour l’indexation de l’image. Etude de cas : La collection du Musée International d’Art Naïf</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L’objectif de notre étude est l’indexation d’un corpus d’images conservées dans une banque de données afin de les retrouver au travers de ressources textuelles qui leur sont liées. Le corpus est constitué de 897 photos d’objets d’art (tableaux, dessins, sculptures…) issus de la collection du Musée International d’Art Naïf de Vicq. Une typologie des textes et fragments textuels liés au corpus d’images a été établie, avant de définir des méthodes et outils de TAL pour leur traitement. L’outil principal créé est une hiérarchie de mots-clés. Il s’agit d’une version simplifiée et très réduite du thesaurus iconographique de François Garnier, réalisée après adaptation au corpus d’images et enrichissement au moyen d’un traitement automatique de ressources textuelles liées à ce corpus.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2007" hreflang="fr">indexation de l’image</a></div> <div class="field__item"><a href="/taxonomy/term/2008" hreflang="fr">corpus d’images</a></div> <div class="field__item"><a href="/taxonomy/term/2009" hreflang="fr">Traitement Automatique des Langues</a></div> <div class="field__item"><a href="/taxonomy/term/2010" hreflang="fr">thesaurus iconographique</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 133 at https://ertim.inalco.fr