agglutination https://ertim.inalco.fr/ fr Traitement automatique de l’arabe – Problématique de l’étiquetage grammaticale https://ertim.inalco.fr/node/156 <span class="field field--name-title field--type-string field--label-hidden">Traitement automatique de l’arabe – Problématique de l’étiquetage grammaticale</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2003</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Notre étude consistera à traiter la question de l’étiquetage grammaticale de la langue arabe en insistant sur la problématique que posent les deux spécificités inhérentes à cette langue, à savoir : l’agglutination et la non voyellation ou la voyellation partielle des textes. L’étiquetage d’un texte en arabe requiert la restitution des voyelles. Mais comment restituer les voyelles puisque cette opération dépend de la détermination des étiquettes grammaticales ? Nous sommes donc confronté à un cercle vicieux. Le problème d’ambiguïté est ainsi posé. En effet, étiqueter un texte dépourvu de voyelles, c’est étiqueter un texte grammaticalement ambigu. Il s’agit donc de lever cette ambiguïté, qu’elle soit lexicale ou grammaticale. De nombreux efforts ont été déployés dans ce sens. Nous ferons donc un état de l’art, présentant les différentes approches appliquées jusqu’à ce jour, les différentes grammaires et modèles adoptés ainsi que les différents outils développés en vue d’effectuer une analyse syntaxique, voire morphosyntaxique d’un texte donné, dans le but de venir à bout de ce problème. Nous mettrons en évidence les points forts, mais également, les limites des travaux effectués. A partir de là nous tenterons de proposer une solution potentielle.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2096" hreflang="fr">traitement automatique du langage naturel</a></div> <div class="field__item"><a href="/taxonomy/term/1834" hreflang="fr">langue arabe</a></div> <div class="field__item"><a href="/taxonomy/term/2097" hreflang="fr">étiquetage grammatical</a></div> <div class="field__item"><a href="/taxonomy/term/2098" hreflang="fr">voyellation automatique</a></div> <div class="field__item"><a href="/taxonomy/term/1930" hreflang="fr">agglutination</a></div> <div class="field__item"><a href="/taxonomy/term/1965" hreflang="fr">ambiguïté</a></div> <div class="field__item"><a href="/taxonomy/term/2099" hreflang="fr">approche distributionnelle</a></div> <div class="field__item"><a href="/taxonomy/term/2100" hreflang="fr">analyse syntaxique</a></div> <div class="field__item"><a href="/taxonomy/term/1931" hreflang="fr">analyse morphologique</a></div> <div class="field__item"><a href="/taxonomy/term/1839" hreflang="fr">segmentation</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 156 at https://ertim.inalco.fr La représentation du turc en Unitex https://ertim.inalco.fr/node/116 <span class="field field--name-title field--type-string field--label-hidden">La représentation du turc en Unitex</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Bisazza</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2008</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Cette étude présente un modèle pour la représentation du turc dans la plate-forme de traitement de corpus Unitex. Le choix du modèle est déterminé principalement par la morphologie agglutinante du turc et s&#039;appuie sur une étude des outils linguistiques existants.<br /> <br /> La solution proposée inclut l&#039;emploi de l&#039;analyseur morphologique Zemberek. La liaison entre l&#039;analyse du texte turc produite par Zemberek et les formalismes reconnus par Unitex est assurée par le package Java implémenté. Des exemples d&#039;application des fonctionnalités d&#039;Unitex au turc sont donnés en guise d&#039;évaluation.<br /> <br /> **** <br /> <br />   This study presents a model for the representation of Turkish in the corpus processing platform Unitex. The choice of the model is mainly determined by the agglutinative morphology of Turkish and it relies on a study of the existing language processing tools.<br /> <br /> The solution proposed makes use of the morphological analyzer Zemberek. The link between Zemberek-produced analysis of Turkish text and Unitex-recognized formalisms is carried out by the implemented Java package. Examples of Unitex functionalities applied on Turkish are provided by way of evaluation.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1927" hreflang="fr">turc</a></div> <div class="field__item"><a href="/taxonomy/term/1928" hreflang="fr">turkish</a></div> <div class="field__item"><a href="/taxonomy/term/1929" hreflang="fr">Unitex</a></div> <div class="field__item"><a href="/taxonomy/term/1930" hreflang="fr">agglutination</a></div> <div class="field__item"><a href="/taxonomy/term/1931" hreflang="fr">analyse morphologique</a></div> <div class="field__item"><a href="/taxonomy/term/1932" hreflang="fr">morphological analysis</a></div> <div class="field__item"><a href="/taxonomy/term/1933" hreflang="fr">suffixes subordonnants</a></div> <div class="field__item"><a href="/taxonomy/term/1934" hreflang="fr">subordinating suffixes</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 116 at https://ertim.inalco.fr