lisibilité https://ertim.inalco.fr/ fr Analyse automatique de la lisibilité dans l’apprentissage du portugais comme langue étrangère https://ertim.inalco.fr/node/712 <span class="field field--name-title field--type-string field--label-hidden">Analyse automatique de la lisibilité dans l’apprentissage du portugais comme langue étrangère</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">mar 02/02/2021 - 11:37</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Lucas Elias Fonseca</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2020</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le présent travail a pour but d’explorer quelles variables et techniques de classification de textes présentent le meilleur gain de précision et d’information pour la classification de textes en portugais. Nous testons 30 variables extraites avec le système Pylinguistics, dont 21 sont des mesures basées sur la lisibilité textuelle et 9 sur les différentes parties du discours, considérées pertinentes pour la didactique des langues étrangères. On classe les textes selon leur niveau de difficulté selon l’échelle du Cadre Européen Commun de Référence pour les Langues, allant du niveau A1 au B2. Dans ce but, nous avons constitué un corpus d’entraînement composé de 4 sous-corpus correspondant aux niveaux. Les textes sont issus de méthodesd’enseignement du Portugais Langue Étrangère, de tests de compétence et de textes d’apprenants du corpus COPLE2. Nous analysons les performances de 4 méthodes de classification: Naïve-Bayes, machines de vecteur à support, régression logistique et arbres de décisions. Nous évaluons aussi la pertinence de différentes variables pour la tâche proposée selon leur corrélation avec les classes, leur gain d’information et leur ratio de gain d’information. La méthode de classification basée sur la régression logistique s’est montrée la plus performante avec 50,42% de textes classés correctement, avec une meilleure performance pour les niveaux A1 et A2. De façon générale, les classifieurs ont été moins performants pour les niveaux A2 et B1, impactant le résultat global des classificateurs. Le ratio de gain d’information a présenté le meilleur résultat dans la classification des variables, avec une amélioration de la performance des arbres de décision. Lesvariables basées sur la didactique des langues étrangères se sont montrées peu performantes dans l’optimisation de la classification des textes.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2648" hreflang="fr">portugais comme langue étrangère</a></div> <div class="field__item"><a href="/taxonomy/term/2649" hreflang="fr">algorithmes de classification</a></div> <div class="field__item"><a href="/taxonomy/term/2362" hreflang="fr">lisibilité</a></div> <div class="field__item"><a href="/taxonomy/term/2650" hreflang="fr">didactique des langues étrangères</a></div> <div class="field__item"><a href="/taxonomy/term/1843" hreflang="fr">corpus</a></div> <div class="field__item"><a href="/taxonomy/term/2364" hreflang="fr">apprentissage automatique</a></div> </div> </div> Tue, 02 Feb 2021 10:37:09 +0000 gestionnaire 712 at https://ertim.inalco.fr La lisibilité dans le contexte de l'écologie numérique https://ertim.inalco.fr/node/627 <span class="field field--name-title field--type-string field--label-hidden">La lisibilité dans le contexte de l&#039;écologie numérique</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Margaux Duhayon</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2019</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La pollution numérique est une notion qui est peu démocratisée chez les utilisateurs et les concepteurs d&#039;applications, de logiciels et de sites web. Pourtant, l&#039;envoi d&#039;un mail ou une recherche sur un moteur de recherche est source de pollution en consommant de l&#039;énergie. L&#039;écologie numérique est une réponse à cette pollution grâce à des actions permettant de limiter les impacts environnementaux de nos équipements numériques. Nous souhaitons proposer, avec ce mémoire, des outils de traitement automatique des langues dans le contexte de l&#039;écologie numérique. Pour cela, nous nous appuyons sur la bonne pratique de l&#039;éco-conception qui vise à rendre les textes d&#039;un site web les plus accessibles possible. Nous nous intéressons donc à la lisibilité des textes présents sur les sites web en expérimentant sur des clusters obtenus à l&#039;aide d&#039;algorithmes de classification non supervisée.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2524" hreflang="fr">pollution numérique</a></div> <div class="field__item"><a href="/taxonomy/term/2525" hreflang="fr">écologie numérique</a></div> <div class="field__item"><a href="/taxonomy/term/2526" hreflang="fr">plongement de documents</a></div> <div class="field__item"><a href="/taxonomy/term/2527" hreflang="fr">doc2vec</a></div> <div class="field__item"><a href="/taxonomy/term/2364" hreflang="fr">apprentissage automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2362" hreflang="fr">lisibilité</a></div> <div class="field__item"><a href="/taxonomy/term/2528" hreflang="fr">éco-conception web</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 627 at https://ertim.inalco.fr Prédiction de la difficulté des textes coréens pour les apprenants. Expériences de classification automatique https://ertim.inalco.fr/node/619 <span class="field field--name-title field--type-string field--label-hidden">Prédiction de la difficulté des textes coréens pour les apprenants. Expériences de classification automatique </span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Arthur Provenier</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2018</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce mémoire vise à prédire la difficulté de textes pour les apprenants du coréen. À partir d’un corpus élaboré de manuels destinés à l’enseignement du coréen, nous essayons de définir des variables lexicales et syntaxiques qui peuvent nous permettre de discriminer la lisibilité des textes. Après en avoir établi la liste, nous employons des coefficients de corrélation afin de sélectionner les plus pertinentes. Enfin, à l’aide de plusieurs algorithmes de classification automatique, nous essayons de déterminer le modèle le plus efficace.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2362" hreflang="fr">lisibilité</a></div> <div class="field__item"><a href="/taxonomy/term/2488" hreflang="fr">coréen langue étrangère</a></div> <div class="field__item"><a href="/taxonomy/term/1804" hreflang="fr">classification</a></div> <div class="field__item"><a href="/taxonomy/term/2364" hreflang="fr">apprentissage automatique</a></div> <div class="field__item"><a href="/taxonomy/term/2489" hreflang="fr">variable lexicale</a></div> <div class="field__item"><a href="/taxonomy/term/2490" hreflang="fr">variable syntaxique</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 619 at https://ertim.inalco.fr Pratique de la lecture en L2 : classification automatique de textes en thaï par progression lexicale https://ertim.inalco.fr/node/580 <span class="field field--name-title field--type-string field--label-hidden">Pratique de la lecture en L2 : classification automatique de textes en thaï par progression lexicale</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2015</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La création automatique de ressources pour l’apprentissage de langues étrangères peu enseignées et peu dotées en matériels pédagogiques est particulièrement séduisante. Or, le développement de méthodes spécifiques à une langue étant souvent problématique en termes de rentabilité quand les effectifs d’apprenants sont restreints, il est intéressant de considérer comment adapter des ressources existantes ou de développer des méthodes génériques adaptables pour la création de matériel pédagogique. Cette étude concerne l’adaptation à la langue thaïe du logiciel ​​ TextLadder, qui classifie ​l​ es textes d’un corpus dans un ordre qui maximise la facilité de lecture pour l’apprenant, en calculant la similarité lexicale entre les textes. Cette classification automatique de textes par la progression lexicale constitue une méthode intéressante pour proposer une séquence de textes appropriée au niveau d’un lecteur en L2, surtout en ce qui concerne les textes qui portent sur une thématique particulière, que ce soit pour proposer des textes à des lecteurs autonomes, ou pour la création de matériel pédagogique destiné à être utilisé en classe.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2348" hreflang="fr">alao</a></div> <div class="field__item"><a href="/taxonomy/term/2349" hreflang="fr">aide à la lecture</a></div> <div class="field__item"><a href="/taxonomy/term/2360" hreflang="fr">thaï</a></div> <div class="field__item"><a href="/taxonomy/term/2361" hreflang="fr">langue étrangère</a></div> <div class="field__item"><a href="/taxonomy/term/2362" hreflang="fr">lisibilité</a></div> <div class="field__item"><a href="/taxonomy/term/2363" hreflang="fr">textladder</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/M%C3%A9moire_M2_LEWIS-WONG_Jennifer_.pdf" type="application/pdf">Mémoire_M2_LEWIS-WONG_Jennifer_.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 580 at https://ertim.inalco.fr