polonais

Modèle de reconnaissance statistique pour le turc oral

Résumé
Kristina est un agent social capable d'interagir avec les humains. Le système ASR a besoin de trois modèles: modèle de langage modèle acoustique et lexique de prononciation. Le but du travail est de collecter des données en ligne et de trouver les meilleures données pour KRISTINA. Nous utilisons deux façons différentes de comparaison: selection par perplexité et par recherche de l'information.

La résolution des ambiguïtés des langues naturelles (polonais) et artificielles (espéranto) lors de leur traduction automatique

Résumé
La traduction automatique se heurte au phénomène des ambiguïtés. Ces ambiguïtés peuvent être d’ordre lexical (flexion, homonymie, catégorie) ou structurel (hiérarchie, syntaxe). Quel est donc le degré de ces ambiguïtés dans une langue naturelle hautement flexionnelle, telle que le polonais et dans une langue artificielle à forte structure auxiliaire telle l’espéranto? Comment l’acquisition des connaissances appliquée à la traduction automatique facilite-t-elle la résolution des ambiguïtés ? La présentation d’exemples d’ambiguïtés relatives aux langues polonais et espéranto permet de définir une typologie d’ambiguïtés spécifiques. L’utilisation des différents outils de traduction automatique fait apparaître les limites de la qualité des résultats. L’utilisation de capacités cognitives de plus en plus puissantes est un axe d’amélioration. L’étude d’une modélisation croisée, associant un système symbolique et statistique, corrélée à une optimisation de la compréhension des contextes, est un scénario probable pour résoudre les ambiguïtés.

Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation

Résumé
Puisque les chercheurs se concentrent plus sur les corpus bilingues, nous nous intéressons dans un premier temps à la situation des outils de traitement des corpus multilingues (plus de trois langues), y compris les langues slaves. Les outils pris en compte concernent l'alignement et l'extraction des termes, mais nous nous intéressons aussi aux concordanciers. Dans un second temps, nous appliquons les outils accessibles à notre corpus pour observer les occurrences extraites du corpus dans leur contexte immédiat et ensuite, l'alignement effectué pour analyser des équivalences en traductions. A l’avenir, le traitement de ce corpus pourrait aboutir à un lexique quadrilingue spécialisé en programmation.