localisation

Implementation of a new language into a rule-based Spoken Dialogue System

Résumé
Le but de cette étude est de fournir une solution pour implémenter une nouvelle langue dans un système de dialogue vocal basé sur des règles. Notre approche repose sur l’hypothèse selon laquelle la traduction automatique peut aider à résoudre le problème de la portabilité vers une nouvelle langue. Nous procédons à la traduction automatique du système de dialogue de l’anglais vers le mandarin et évaluons ses performances. Les résultats indiquent que cette approche est efficace pour concevoir un système de dialogue multilingue.

Traduction et Internet

Résumé
Avec la généralisation d’Internet, un site web multilingue représente un moyen à faible coût de faire connaître son entreprise et ses produits et de pénétrer rapidement et efficacement de nouveaux marchés.

La conversion d’un site web dans une autre langue représente une tâche qui dépasse le cadre d’un simple travail de traduction. Ce processus d’adaptation fait appel à des talents différents, mais complémentaires.

Aujourd’hui, la plupart des agences de traduction proposent la localisation de sites web.

Ce mémoire offre un bref aperçu de certains acteurs de la profession, de leurs méthodes de travail et des principales techniques mises en œuvre.

Gestion de l’information dans le cadre de l’internationalisation d’un logiciel

Résumé
Il existe aujourd’hui une grande diversité de logiciels sur le marché, et ceux-ci ont pris une place importante dans notre vie quotidienne, aussi bien au travail qu’à la maison. Désormais, l'objectif principal des éditeurs n'est plus seulement de vendre, mais aussi d'exporter leurs produits. On parle alors d’internationalisation, qui consiste à concevoir un logiciel de façon à ce qu'il s'adapte aisément à divers paramètres socioculturels : cela permet d’une part de faciliter sa localisation, et d'autre, de réduire les coûts et de d’accélérer la commercialisation. Le rédacteur technique à un rôle important à jouer : il participe à la création du logiciel en rédigeant la description de son contenu, mais également en écrivant la documentation utilisateur. Ce travail traitera des problèmes spécifiques liés à la conception d’un logiciel et à la structuration d'une aide en ligne, et couvrira une ontologie du domaine de la conception d'un logiciel, et plus particulièrement de l’aide en ligne en français et en anglais.

Extraction d'une terminologie bilingue à partir d'un corpus parallèle regroupant les ressources produites suite à un projet de localisation en arabe de l’environnement Linux

Résumé
Arabeyes est un projet qui vise à produire, et à maintenir à jour, une distribution arabe du système Linux. Ceci nécessite d’importants efforts de traduction, et le développement d’outils logiciels spécifiques. L’objectif de notre travail est d’exploiter tous les travaux de traduction, réalisés dans le cadre de ce projet, afin d’extraire des ressources terminologiques anglais /arabe concernant la localisation des logiciels libres.

La première étape du travail consiste à récupérer, et à filtrer, tous les fichiers contenant les traductions, puis ensuite regrouper les messages provenant de ces fichiers dans un seul corpus parallèle. Pour former une première liste de candidats termes bilingues, nous récupérons tous les messages susceptibles de contenir un seul terme, puis à l’aide d'outils d’analyse morphosyntaxique, nous isolons, dans cette liste, les suites de mots correspondant aux catégories qui présentent plus d’intérêts terminologiques. 

La deuxième étape consiste à implémenter une méthode d’alignement basée sur le calcul des fréquences des cooccurrences. Cette technique d’alignement sera exploitée pour obtenir de nouveaux couples de candidats termes à partir du corpus. Pour filtrer les résultats, nous  comparons les catégories  des suites de mots obtenues, et nous gardons les couples de candidats termes qui se correspondent le plus