corpus parallèles https://ertim.inalco.fr/ fr Constitution d’un corpus bilingue aligné français-persan https://ertim.inalco.fr/node/148 <span class="field field--name-title field--type-string field--label-hidden">Constitution d’un corpus bilingue aligné français-persan</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2003</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire présente une méthode d’alignement de corpus parallèles. Nous utiliserons un corpus journalistique bilingue français-persan constitué à partir des numéros d’avril à septembre 2003 du Monde diplomatique. La première phase consistera à aligner deux corpus, paragraphe par paragraphe. Ensuite, nous procéderons à une évaluation des problèmes rencontrés et nous proposerons des critères permettant d’améliorer les performances de cette méthode.<br /> <br /> Notre objectif est d’aligner deux langues de système graphique différent, en l’occurrence le persan et le français, et d’en présenter les limites et par la même occasion, les outils qui ont été utilisés pour mener à bien ce travail. Après une brève description de la structure du persan, nous tâcherons de décrire les différences morpho-syntaxiques par rapport au français. Et enfin, l’analyse des résultats de l’alignement permettra de mettre en lumière les difficultés et les complexités de notre démarche.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/2072" hreflang="fr">corpus parallèles</a></div> <div class="field__item"><a href="/taxonomy/term/2073" hreflang="fr">bitextes</a></div> <div class="field__item"><a href="/taxonomy/term/2074" hreflang="fr">concordancier</a></div> <div class="field__item"><a href="/taxonomy/term/1761" hreflang="fr">multilinguisme</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 148 at https://ertim.inalco.fr