ambiguïté

Traitement automatique de l’arabe – Problématique de l’étiquetage grammaticale

Résumé
Notre étude consistera à traiter la question de l’étiquetage grammaticale de la langue arabe en insistant sur la problématique que posent les deux spécificités inhérentes à cette langue, à savoir : l’agglutination et la non voyellation ou la voyellation partielle des textes. L’étiquetage d’un texte en arabe requiert la restitution des voyelles. Mais comment restituer les voyelles puisque cette opération dépend de la détermination des étiquettes grammaticales ? Nous sommes donc confronté à un cercle vicieux. Le problème d’ambiguïté est ainsi posé. En effet, étiqueter un texte dépourvu de voyelles, c’est étiqueter un texte grammaticalement ambigu. Il s’agit donc de lever cette ambiguïté, qu’elle soit lexicale ou grammaticale. De nombreux efforts ont été déployés dans ce sens. Nous ferons donc un état de l’art, présentant les différentes approches appliquées jusqu’à ce jour, les différentes grammaires et modèles adoptés ainsi que les différents outils développés en vue d’effectuer une analyse syntaxique, voire morphosyntaxique d’un texte donné, dans le but de venir à bout de ce problème. Nous mettrons en évidence les points forts, mais également, les limites des travaux effectués. A partir de là nous tenterons de proposer une solution potentielle.

Analyse des problèmes posés par le Japonais dans un contexte de recherche d’informations

Résumé
Le moteur de recherche Google s’est imposé ces dernières années comme l’outil de recherche d’information le plus performant pour le grand public. Ce mémoire propose de tester la version japonaise du moteur et d’en analyser les faiblesses. Nous nous pencherons tout d’abord sur les problèmes que pose la pluralité des écritures : en quoi l’utilisateur peut il passer à côté de résultats pertinents en effectuant des requêtes dans une langue où jusqu’à 4 graphies différentes peuvent être utilisées dans un même corpus ? Vient alors la question de la segmentation en Japonais : comment le moteur réagit il face à une langue où les espaces n’existent pas ? Enfin, notre travail se terminera par une étude des ambiguïtés phonétiques et lexicales propres à la langue de Mishima : comment peut on améliorer le traitement des néologismes et des transcription phonétiques à partir d’autres langues ? Après avoir effectué plusieurs tests sur le moteur, nous analyserons les problèmes pour finalement proposer des méthodes et solution permettant d’améliorer la pertinence des résultats.

Traduction humaine dans la perspective du développement de la traduction automatique

Résumé
Dans mon mémoire de DESS, j'aborde la problématique linguistique (traduction) dans la perspective du développement informatique (nouvelles technologies-logiciels de traduction automatique). Il s'agit de traiter la question de la traduction « traditionnelle » vs la traduction automatique. L'enjeu de mon travail est de démontrer quels sont les points forts et les points faibles ainsi que les limites et les difficultés liés à ces deux façons de traduire: humaine et informatisée.Pour illustrer mes observations, je m'appuie sur les exemples précis. J'établis un corpus bilingue (langue source français-langue cible anglais) extrait du Journal Officiel de la Communauté européenne et j'examine les traductions: premièrement traditionnelle publiée dans une version anglaise du Journal Officiel, ensuite celle traitée par le logiciel de traduction automatique REVERSO et celle traitée par le logiciel de traduction gratuit disponible sur le moteur de recherche YAHOO. Par la suite, je procède à l’extraction terminologique en établissant une liste des termes et des expressions que je compare premièrement avec la terminologie traditionnelle du dictionnaire-papier, et ensuite avec le dictionnaire en ligne FREELANG et la base terminologique de la Communauté européenne - EUROVOC. Les commentaires des résultats obtenus me servent de conclusion : quels sont la place et le rôle du traducteur face à la prolifération des outils de traduction automatique, quel est l’avenir de la TA et de la TAO de point de vue de l’efficacité, de la disponibilité, du coût et du temps de traduction ? Est-ce que le progrès technologique accompagne les méthodes traditionnelles et en quoi est-il complémentaire? Arrivera-t-on à maîtriser l’ambiguïté du langage humain du point de vue de la traduction?