multilinguisme

Aide au codage d'un dictionnaire morphosyntaxique

Résumé
Ce mémoire présente une réflexion sur le moyen d’améliorer les procédures utilisées pour l’acquisition et le codage de données lexicales dans un contexte multilingue, au sein de la société Sinequa.Après une observation de l’état des procédures et des ressources en cours, une évaluation des problèmes et des besoins sera effectuée et plusieurs propositions seront envisagées à différents termes.

Construction de ressources terminologiques pour un traducteur automatique : une approche textuelle

Résumé
Notre projet prend place dans une étude menée par EADS-CCR (Centre Commun de Recherche) pour le département de veille de EADS-LV (Launch Vehicles). Une des activités de ce département (SN/S) est la veille stratégique et technologique sur les produits, entreprises et pays concurrents dans le domaine des lanceurs. Dans le cadre de cette veille, le département utilise le logiciel de traduction automatique Reverso de Softissimo, notamment comme outil d'aide à la compréhension de documents russes. Notre travail a consisté à enrichir le dictionnaire utilisateur russe-français sur les lanceurs à partir de corpus de textes représentatifs de ceux que les veilleurs exploitent habituellement. Nous avons dans un premier temps constitué à l'aide de la plate-forme Xerox Terminology Suite une base de données terminologique trilingue (russe-anglais-français) que nous avons ensuite enrichie manuellement en reliant les termes par des relations de traduction. En parallèle de ce travail, nous avons réfléchi sur la problématique de la réutilisabilité des données terminologiques au sein de EADS et dans le milieu industriel en général. 

Etude comparative de deux outils de TAO

Résumé
Le service de traduction du Parlement européen est une structure unique qui présente des caractéristiques très spécifiques. En effet, il faut gérer un très grand nombre de couples de langues et les documents sont d'une diversité extrêmement grande. Les outils pour aider le traducteur dans sa tâche sont très nombreux et variés. C'est la traduction assistée qui se prête le mieux aux besoins internes des traducteurs. L'outil utilisé jusqu'à présent était le TWB de la société Trados. Cependant, un autre programme a été mis au point en interne et il est actuellement en phase finale de test. Le travail de recherche que j'ai effectué au sein de cette institution pendant mon stage consiste à confronter le TWB avec FUSE, le nouvel outil de traduction assistée mis au point par un informaticien interne. Dans mon étude je cherche à savoir pourquoi un outil généraliste tel que le TWB ne s'est pas montré totalement efficace pour certains documents et a nécessité la création d'un nouvel outil. S'agit-il d'une faille au niveau du programme lui-même (problème structurel) ou bien, est-ce dû au contexte dans lequel cet outil est utilisé (problème environnemental) ? A travers une étude comparative des performances de ces deux outils sur un type de document particulier j'essaierai de montrer les aspects positifs et négatifs de chacun d'eux.

Constitution d’un corpus bilingue aligné français-persan

Résumé
Ce mémoire présente une méthode d’alignement de corpus parallèles. Nous utiliserons un corpus journalistique bilingue français-persan constitué à partir des numéros d’avril à septembre 2003 du Monde diplomatique. La première phase consistera à aligner deux corpus, paragraphe par paragraphe. Ensuite, nous procéderons à une évaluation des problèmes rencontrés et nous proposerons des critères permettant d’améliorer les performances de cette méthode.

Notre objectif est d’aligner deux langues de système graphique différent, en l’occurrence le persan et le français, et d’en présenter les limites et par la même occasion, les outils qui ont été utilisés pour mener à bien ce travail. Après une brève description de la structure du persan, nous tâcherons de décrire les différences morpho-syntaxiques par rapport au français. Et enfin, l’analyse des résultats de l’alignement permettra de mettre en lumière les difficultés et les complexités de notre démarche.

L'expression du multilinguisme dans la gestion de l'information sur le net, cas de la cohabitation des langues de cultures et des langues congolaises

Résumé
Ce travail est une réflexion concernant la gestion d’une information commune sur un site internet multilingue, impliquant des langues de familles différentes.

Nous avons fait le choix d’une telle activité impliquant trois langues de grande culture (anglais, français, roumain) et trois langues congolaises (lingala, munukutuba et tsangui). Sachant que les deux premières langues congolaises ont des rapports d’influence réciproque avec le français du fait de la colonisation.

Nous tentons de répondre à la question de savoir, comment gérer une information commune sur un site internet multilingue, quand les langues en présence peuvent exprimer des paradigmes pour le moins différents ?<

Web sémantique, Multilinguisme, dans le domaine du Tourisme

Résumé
Le Web Sémantique est au cœur du débat sur le futur du web.

Le rendre accessible à tous suppose qu’il soit ouvert à toutes les langues et c’est le cas grâce au langage XML. Or il se heurte aux problématiques liées au multilinguisme, notamment la modélisation des ontologies.

Dans le domaine du tourisme, les internautes ont massivement adopté l’Internet comme mode de recherche d’information pour préparer leurs vacances. C’est pourquoi cette industrie représente un domaine particulièrement favorable aux applications du web sémantique tant sur le plan de la gestion de l’information et de l’indexation que sur un plan multilingue.

L’étude du portail touristique de l’Agence de Développement Touristique de la Nièvre, dont le contenu et les connaissances sont gérés par l’entreprise Mondeca, permet de mesurer, à échelle réduite, l’état d’avancement et la pertinence du projet de Web Sémantique. 

The Semantic Web is at the heart of the debate on the future of the Web.

Thanks to XML language it is now openly available to everyone. But it faces multilingual problems most notably the modeling of ontologies.

In the field of tourism, the web surfers massively adopted the Internet as a means to seek information to prepare their holidays. This is why this industry represents a field particularly favorable to the applications of the semantic Web as much as in indexing and information management as on a multilingual level.

The study of the tourist web site of the Tourist Agency of Development of Nievre, whose contents and knowledge are managed by the Mondeca company, makes it possible to measure, on a reduced scale, the progress and the relevance of the project of the Semantic Web.

Constitution d'une base de données terminologique pour un portail Intranet collaboratif

Résumé
La terminologie et la constuction de ressources terminologiques sont des activités qui se développent de plus en plus dans les entreprises. Leurs applications sont diverses: capitalisation des connaissances, outils d'aide à la traduction... Par ailleurs, les entreprises s'orientent vers la mise en place de pratiques collaboratives et de communautés de pratique pour faciliter la communication interne. Le travail présenté dans ce mémoire a donc tenté d'aborder ces deux problématiques dans le cadre de la construction d'une base de données terminologique pour un portail Intranet Collaboratif dans une grande entreprise.

Comment construire cette terminologie?

Comment envisager sa maintenance et son évolution dans un contexte collaboratif?

Telles sont les questions qui ont été soulevées dans ce mémoire.

NTIC & éthiques: quelle valeur posséde l'information en ligne ?

Résumé
L'avénement de la société de l'information redéfinit l'économie en une 'nouvelle économie' numérique. L'entreprise doit apprendre à communiquer différemment pour profiter des opportunités commerciales que lui offre le Web. Le consommateur, quant à lui, ne se contente plus de subir l'information en spectateur passif.

Les outils de recherches 'moteurs de recherche en téte' ont remplacé les documentalistes et sont aujourd'hui plébiscités. Les modéles économiques qui y sont rattachés introduisent des biais supplémentaires dans la recherche et le traitement de l'information par le consommateur final.