chinois

Étude comparative des expressions polylexicales verbales en français et en chinois : éléments linguistiques, statistiques et TAL

Résumé
Ce travail porte sur une étude comparative des expressions polylexicales verbales en français et en chinois. Nous essayons d’abord de valider l’hypothèse sur la noncompositionnalité des expressions polylexicales et les chaînes de coréférence, selon laquelle les composants d’une expression polylexicale verbale sont peu susceptibles d’être repris dans une chaîne de coréférence. Ensuite, en se basant sur les fautes observées pendant l’annotation manuelle, les analyses statistiques des traits et nos connaissances sur la langue chinoise, nous supposons que l’hypothèse se comporte de manière similaire en chinois, et proposons des points à affiner dans l’hypothèse, ainsi que des pistes possibles pour améliorer l’identification automatique des expressions polylexicales verbales en français et en chinois.

Comparaison des résultats de trois outils de segmentation en mots du Chinois sur un corpus issu de forums sur le diabète

Résumé
Ce travail rend compte de la comparaison entre les résultats de trois outils de segmentation automatique en mots du Chinois. L'intérêt est de montrer comment les trois outils diffèrent dans leur interprétation de particularités linguistiques de la langue chinoise, entre eux et par rapport à une segmentation humaine. Pour cela un corpus brut a été constitué par extraction d'un forum chinois traitant du diabète ; ce corpus de taille limitée contient des tournures et du vocabulaire spécifiques à la langue chinoise et au domaine. L'analyse de quelques exemples linguistiquement représentatifs montre qu'aucun des outils de segmentation n'est entièrement fiable et que les erreurs entre eux ne sont pas homogènes. En conclusion, une démarche pragmatique est proposée pour guider le choix d'un outil de segmentation en mots comme préalable aux traitements automatiques à réaliser sur des textes chinois.

Etude de l’Outil de TAO dans le Domaine de la Traduction Technique

Résumé
L’étude du logiciel de TAO - Transit de Star pour utilisation dans une entreprise sino-française dans le domaine de l’acier. L’étude porte sur la constitution de terminologie, les fonctions de logiciel, les problèmes rencontrés dans l’utilisation de la traduction des textes anglais- chinois. Quelles taches supplémentaires sous Transit doit-on effectuer pour la traduction de la langue chinoise en langues européennes et réciproquement.

Exploitation d’un corpus parallèle trilingue : le travail du Centre d’Ingénierie Hydraulique d’Edf en Chine

Résumé
Nous présentons ici les différentes étapes du traitement d’un corpus parallèle multilingue issu de la pratique professionnelle d’ingénieurs en mission d’expertise en Chine.

Nous étudions les particularités d’un corpus à la fois relativement hétérogène et rare, et cherchons des solutions aux problèmes posés par ces caractéristiques.Notre approche étant avant tout pratique, nous mettons en œuvre une chaîne de traitement permettant d’extraire de ces documents le plus de données exploitables possible, et cherchons à évaluer, lors de l’alignement du corpus jusqu’au niveau des mots et des caractères chinois, les impacts des choix faits durant les étapes de préparation du corpus

Construction de ressources terminologiques à l'usage d'interprétes bénévoles d'une mission de promotion de la santé auprés de femmes chinoises se prostituant

Résumé
Notre recherche a consisté à développer une méthode pour constituer des ressources lexicales à l'usage d'interprétes bénévoles français-chinois d'une mission de Médecins du Monde auprés de femmes chinoises qui se prostituent.

Les questions abordées dans le cadre du travail sur le terrain ayant souvent trait à l'intime, il a fallu trouver des solutions pour aborder des thématiques à premiére vue scabreuses.

Nous avons analysé des cas très précis et proposé des solutions sur mesures.