La représentation du turc en Unitex

Auteur
Bisazza
Année
2008
Résumé
Cette étude présente un modèle pour la représentation du turc dans la plate-forme de traitement de corpus Unitex. Le choix du modèle est déterminé principalement par la morphologie agglutinante du turc et s'appuie sur une étude des outils linguistiques existants.

La solution proposée inclut l'emploi de l'analyseur morphologique Zemberek. La liaison entre l'analyse du texte turc produite par Zemberek et les formalismes reconnus par Unitex est assurée par le package Java implémenté. Des exemples d'application des fonctionnalités d'Unitex au turc sont donnés en guise d'évaluation.

**** 

  This study presents a model for the representation of Turkish in the corpus processing platform Unitex. The choice of the model is mainly determined by the agglutinative morphology of Turkish and it relies on a study of the existing language processing tools.

The solution proposed makes use of the morphological analyzer Zemberek. The link between Zemberek-produced analysis of Turkish text and Unitex-recognized formalisms is carried out by the implemented Java package. Examples of Unitex functionalities applied on Turkish are provided by way of evaluation.