extraction de données textuelles à partir de corpus électroniques https://ertim.inalco.fr/ fr Alignement de corpus bilingue franco-arabe à l'aide d'un outil de segmentation automatique donné afin de créer des ressources et d'obtenir des informations linguistiques pour développer de nouveaux outils informatiques de traitement automatique de corpus https://ertim.inalco.fr/node/132 <span class="field field--name-title field--type-string field--label-hidden">Alignement de corpus bilingue franco-arabe à l&#039;aide d&#039;un outil de segmentation automatique donné afin de créer des ressources et d&#039;obtenir des informations linguistiques pour développer de nouveaux outils informatiques de traitement automatique de corpus</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Présentation d&#039;une problématique donnée telle que l&#039;alignement d&#039;un corpus franco-arabe sous un double aspect : identification des principaux problèmes spécifiques à l&#039;alignement de corpus bilingue à l&#039;aide d&#039;outils de traitement automatique des langues et identification des problèmes spécifiques à un corpus franco-arabe donné à l&#039;aide d&#039;un outil de segmentation automatique donné (AlignEdit). Identification des repères fiables et non-fiables (tels que les chiffres, les nombres, les dates et les entités nommées) susceptibles d&#039;être utilisés par des outils de segmentation et d&#039;analyse syntaxique automatique en fonction des particularités de la structure grammaticale et syntaxique de la langue arabe mise en comparaison avec celles de la langue française dans un corpus obtenu à l&#039;aide d&#039;un outil automatique de capture et constitution de corpus électroniques.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2003" hreflang="fr">alignement de corpus bilingue (franco-arabe)</a></div> <div class="field__item"><a href="/taxonomy/term/2004" hreflang="fr">outils de segmentation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2005" hreflang="fr">parseur (AlignEdit)</a></div> <div class="field__item"><a href="/taxonomy/term/1987" hreflang="fr">traitement automatique des langues</a></div> <div class="field__item"><a href="/taxonomy/term/2006" hreflang="fr">extraction de données textuelles à partir de corpus électroniques</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 132 at https://ertim.inalco.fr