collocations https://ertim.inalco.fr/ fr Prise en compte de la dimension collocative dans la notation automatique de productions écrites en français langue étrangère https://ertim.inalco.fr/node/750 <span class="field field--name-title field--type-string field--label-hidden">Prise en compte de la dimension collocative dans la notation automatique de productions écrites en français langue étrangère</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>admin</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 26/01/2024 - 16:42</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Fabienne AUFFRET</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2021</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail s’inscrit dans la continuité de celui de plusieurs personnes, qui ont déjà construit un modèle et ses caractéristiques pour classer des copies de tests de français (pour l’obtention du statut de résident ou de la naturalisation, en France ou au Canada), ceci dans un premier temps jusqu’à un niveau intermédiaire, puis sur l’ensemble des niveaux de langue A1 à C2 du Cadre européen commun de référence pour les langues (Coe, 2001).<br /> De nombreuses études ayant démontré que les collocations au sens large, c’est-à-dire aussi sous leur aspect « collostructions » (collocations qui prennent en compte la structure grammaticale [Stefanowitsch and Gries, 2003], [Paquot, 2018]) permettent de départager entre eux les apprenants de niveau avancé (B2 à C2), nous allons donc créer des caractéristiques qui en sont issues, pour non seulement tenter d’améliorer le modèle existant, mais aussi utiliser des indicateurs pédagogiquement parlants car linguistiquement pertinents ([Valette and Eensoo, 2014] et non pas uniquement distributionnels.<br /> </div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2040" hreflang="fr">collocations</a></div> <div class="field__item"><a href="/taxonomy/term/2364" hreflang="fr">apprentissage automatique</a></div> <div class="field__item"><a href="/en/taxonomy/term/2585" hreflang="en">compétence linguistique</a></div> <div class="field__item"><a href="/en/taxonomy/term/2586" hreflang="en">français langue étrangère</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/AUFFRET_Fabienne_1.pdf" type="application/pdf">AUFFRET_Fabienne_1.pdf</a></span> </div> </div> Fri, 26 Jan 2024 15:42:18 +0000 admin 750 at https://ertim.inalco.fr Détection automatique de l’innovation lexicale dans des corpus diachroniques https://ertim.inalco.fr/node/747 <span class="field field--name-title field--type-string field--label-hidden">Détection automatique de l’innovation lexicale dans des corpus diachroniques</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 10/10/2023 - 16:24</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Solveig PODER</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2021</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le figement lexical est un phénomène central du langage et les expressions figées représentent une importante proportion du lexique de toute langue. Leur détection demeure un des enjeux du TAL. Après avoir effectué un résumé détaillé de l’état de l’art dans ce domaine, ce mémoire présente une méthode non supervisée permettant de détecter la formation de nouvelles expressions figées au sein de corpus diachroniques d’articles de presse en français. On utilisera un modèle LDA (allocation de Dirichlet latente) pour extraire les expressions les plus représentatives du corpus que l’on considèrera comme des candidats au figement. Puis, partant du principe établi par les linguistes qu’une expression est figée si ses termes n’admettent pas d’être remplacés par des synonymes, nous utiliserons des plongements de mots pour établir une liste d’expressions synonymes pour chaque expression candidate. Enfin, nous calculerons l’évolution au fil du corpus du taux d’apparition d’une expression par rapport à ses « synonymes » (nous dresserons automatiquement pour chaque candidat une liste de potentiels synonymes en remplaçant les mots de l’expression candidate par des mots dont la représentation en vecteur est similaire).</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2641" hreflang="fr">expressions polylexicales</a></div> <div class="field__item"><a href="/taxonomy/term/2040" hreflang="fr">collocations</a></div> <div class="field__item"><a href="/taxonomy/term/2643" hreflang="fr">figement lexical</a></div> <div class="field__item"><a href="/taxonomy/term/2545" hreflang="fr">lda</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/PODER_Solveig.pdf" type="application/pdf">PODER_Solveig.pdf</a></span> </div> </div> Tue, 10 Oct 2023 14:24:06 +0000 gestionnaire 747 at https://ertim.inalco.fr Détection de relations morphologiques en corpus basée sur les cooccurrences https://ertim.inalco.fr/node/189 <span class="field field--name-title field--type-string field--label-hidden">Détection de relations morphologiques en corpus basée sur les cooccurrences</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2002</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Notre thématique de recherche est le développement d’un outil pour la détection des variantes morphologiques dérivationnelles dans un corpus spécialisé ici un corpus médical.<br /> <br /> Notre méthode pour construire une base morphologique dérivationnelle est basée sur le regroupement des mots morphologiquement proches qui se trouvent dans un corpus spécialisé. Cette méthode se fonde sur l’observation que les mots morphologiquement apparentés se trouvent à proximité, à une courte distance, dans une fenêtre textuelle d’une taille comparable à celle d’un paragraphe.<br /> <br /> Les regroupements sont réalisés en utilisant une technique de cooccurrences en choisissant une fenêtre de n mots.<br /> <br /> Les cooccurrences sont calculées par un filtrage statistique basé sur le rapport de vraisemblance(likelihood ratio). Un filtrage morphologique sur la « racine » commune permet ensuite de déterminer les mots morphologiquement apparentés. Cette méthode est appliquée à un corpus du domaine médical de 7 millions de mots.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2209" hreflang="fr">morphologie dérivationnelle</a></div> <div class="field__item"><a href="/taxonomy/term/2040" hreflang="fr">collocations</a></div> <div class="field__item"><a href="/taxonomy/term/2210" hreflang="fr">cooccurrences</a></div> <div class="field__item"><a href="/taxonomy/term/2211" hreflang="fr">rapport de vraisemblance</a></div> <div class="field__item"><a href="/taxonomy/term/2212" hreflang="fr">fenêtre textuelle</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 189 at https://ertim.inalco.fr L’utilisation de fonctions lexicales dans une ressource de collocations https://ertim.inalco.fr/node/141 <span class="field field--name-title field--type-string field--label-hidden">L’utilisation de fonctions lexicales dans une ressource de collocations</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2004</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire tente une analyse et une évaluation de l’utilisation de fonctions lexicales dans la constitution d’une ressource de collocations. Les fonctions lexicales utilisées s’inspirent des fonctions lexicales du Dictionnaire Explicatif et Combinatoire de Igor Mel’cuk et al. mais s’en éloignent. Ce travail explique la démarche adoptée pour la constitution de la ressource et évalue l’intérêt de l’utilisation des fonctions lexicales.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2037" hreflang="fr">dictionnaire</a></div> <div class="field__item"><a href="/taxonomy/term/2038" hreflang="fr">fonctions lexicales</a></div> <div class="field__item"><a href="/taxonomy/term/2039" hreflang="fr">théorie Sens-Texte</a></div> <div class="field__item"><a href="/taxonomy/term/2040" hreflang="fr">collocations</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 141 at https://ertim.inalco.fr