base de données terminologique
Résumé
La terminologie est une part importante de la traduction. Elle permet de désambiguïser, mais permet également aux traducteurs de produire un document homogène et cohérent avec le texte de la langue d’origine. Les bases de données terminologiques, dictionnaires multilingues du traducteur, sont des ressources spécialisées dans cette application. Ce mémoire propose une méthode d’automatisation d’entrées de bases terminologiques dont l’approche consiste à extraire les définitions de termes donnés ainsi que la source de ces définitions, et de construire une structure XML compatible avec une base terminologique MultiTerm à partir des données. Les langues traitées ici sont l’anglais, l’allemand et le français, cependant le programme Python qui résulte de ce mémoire peut être adapté à diverses langues et diverses bases de données.
Résumé
Les besoins en terminologie deviennent de plus en plus importants dans les entreprises. En effet, de nombreuses données terminologiques multilingues coexistent sans pour autant être homogènes et normalisées. Dans ce mémoire, nous nous interrogeons donc sur la méthodologie à utiliser afin d'obtenir une base de données terminologique structurée et de qualité. D'autre part, nous posons la question de savoir comment procéder pour éviter la « pollution » de la future base ? Nous comparons trois solutions différentes : extraction terminologique à partir de corpus, tri des données, reprise de l'existant. La première solution serait idéale. Cependant, dans quelle mesure est-il possible de changer les pratiques existantes au profit de la construction terminologique à partir des corpus textuels ? Plusieurs contraintes nous font pencher vers la deuxième solution à savoir tri et récupération d'un fond terminologique en associant un code de fiabilité à chaque terme par exemple.
Parallèlement à cette réflexion, nous proposons un modèle d'un outil de gestion de bases de données terminologiques accessible via l'Intranet. Il est nécessaire que cet outil tienne compte des évolution en matière d'échanges de données terminologiques au format XML (MARTIF, GENETER etc.).
Résumé
La terminologie et la constuction de ressources terminologiques sont des activités qui se développent de plus en plus dans les entreprises. Leurs applications sont diverses: capitalisation des connaissances, outils d'aide à la traduction... Par ailleurs, les entreprises s'orientent vers la mise en place de pratiques collaboratives et de communautés de pratique pour faciliter la communication interne. Le travail présenté dans ce mémoire a donc tenté d'aborder ces deux problématiques dans le cadre de la construction d'une base de données terminologique pour un portail Intranet Collaboratif dans une grande entreprise.
Comment construire cette terminologie?
Comment envisager sa maintenance et son évolution dans un contexte collaboratif?
Telles sont les questions qui ont été soulevées dans ce mémoire.