morphological analysis

Constitution d'une ressource terminologique : exemple d'un glossaire multilingue

Résumé
La conception d'une ressource terminologique multilingue est l'aboutissement de phases successives, auxquelles participent terminologues, linguistes et développeurs, la mise en place d'un glossaire multilingue est un exemple de ces ressources, qui bien réalisé représente un gain en temps et en qualité pour le travail du traducteur. Un état de l'art des analyseurs morphologiques pour certaines langues, notamment pour l'arabe, nous fait apparaître que le défi de la racinisation et de la vocalisation est toujours d'actualité.

La représentation du turc en Unitex

Résumé
Cette étude présente un modèle pour la représentation du turc dans la plate-forme de traitement de corpus Unitex. Le choix du modèle est déterminé principalement par la morphologie agglutinante du turc et s'appuie sur une étude des outils linguistiques existants.

La solution proposée inclut l'emploi de l'analyseur morphologique Zemberek. La liaison entre l'analyse du texte turc produite par Zemberek et les formalismes reconnus par Unitex est assurée par le package Java implémenté. Des exemples d'application des fonctionnalités d'Unitex au turc sont donnés en guise d'évaluation.

**** 

  This study presents a model for the representation of Turkish in the corpus processing platform Unitex. The choice of the model is mainly determined by the agglutinative morphology of Turkish and it relies on a study of the existing language processing tools.

The solution proposed makes use of the morphological analyzer Zemberek. The link between Zemberek-produced analysis of Turkish text and Unitex-recognized formalisms is carried out by the implemented Java package. Examples of Unitex functionalities applied on Turkish are provided by way of evaluation.