Soutenance de thèse de Liyun YAN - 10 juillet 2021

Madame Liyun YAN a le plaisir de vous inviter à la soutenance de sa thèse de doctorat intitulée "Le rôle des inférences pour la fouille d’opinion : applications aux réseaux sociaux en langue chinoise".
 
Celle-ci aura lieu le lundi 5 juillet à 10h.
Un lien de connexion Zoom vous sera communiqué sous peu.
Si vous souhaitez y participer en présentiel, merci de contacter madame Yan : liyun.yan@inalco.fr.
 
la thèse sera présentée en français devant un jury composé de :
M. Mathieu Valette Professeur des universités, INALCO, ERTIM
M. Cyril Grouin Ingénieur de recherche, Université Paris-Saclay, CNRS, LISN
Mme Farah Benamara Maître de conférences, Université Paul Sabatier, CNRS, IRIT
M. Dominique Legallois Professeur des universités, Université Paris 3 Sorbonne Nouvelle, CNRS, LaTTICe
Mme Yue Ma Maître de Conférence, Université Paris-Saclay, CNRS, LISN
Mme Christine Lamarre Professeur des universités, INALCO, EHESS, CNRS, CRLAO
 
Résumé:
 
Cette thèse s'intéresse à l'inférence linguistique dans la fouille d'opinion dans un corpus des commentaires touristiques en chinois. Les techniques existantes qui sont bien développées sur des opinions courtes et explicites donnent des résultats limités dans l'interprétation des contextes implicites. De plus, l'expression de l'opinion met en œuvre des stratégies énonciatives différentes suivant les langues et les cultures. Notre hypothèse de travail consiste à étudier les inférences pour améliorer la fouille d'opinion. Dans cette perspective, notre première contribution propose une typologie des inférences pour le chinois en 5 types: logique, pragmatique, lexicale, énonciative et discursive (Rossi et Campion, 1999; Marin, 2004; Duchêne, 2008; Doucy et Massoussi, 2012). Nous avons appliqué cette typologie pour annoter un corpus, dans l'objectif de mener des expériences de fouille d'opinion avec et sans le traitement des inférences. Notre deuxième contribution se focalise sur la classification automatique des inférences en nous basant sur les caractéristiques linguistiques, les métadonnées du domaine et les vecteurs du plongement de mots. L'objectif d'une part est de prouver que le traitement des inférences améliore la performance de la fouille d'opinion et d'autre part de trouver une solution équilibrée entre la classification manuelle couteuse et la classification automatique. Dans ce travail de thèse, nous avons démontré l'intérêt d'étudier les inférences pour réaliser une fouille d'opinion en chinois. Toutefois, l'identification automatique des inférences reste complexe et nécessite une poursuite des travaux de recherche.