sémantique

Etude comparative des discours de Nestor Kirchner et Cristina Fernandez

Résumé
La présente étude à pour objectif de rendre compte des grandes lignes des discours de Néstor Kirchner et de Cristina Fernández de Kirchner à partir d'une approche qui combine l'Analyse du discours, la sémantique [RASTIER, 1995] et la statistique textuelle [LEBART, SALEM, 1994]. Pour ce faire nous disposons d'un corpus de travail composé des discours présidentiels correspondants au mandat de Kirchner (2003-2007) et au premier mandat de Fernandez (2007-2011) recueillis de la page officielle de la " Presidencia de la Nación Argentina ". Ce corpus constitue donc ce qu'on appelle une " série textuelle chronologique ". Dans un premier temps nous introduirons le cadre théorique sur lequel s'appuiera notre travail, à savoir, les concepts de base relatifs à l'Analyse du discours et à la Lexicométrie (objet d'étude, principales méthodes, etc.), nous signalerons les avantages et les limites pour combiner les deux approches et nous ferons une brève présentation de notre corpus ainsi comme du contexte dans lequel ces discours ont été produits. Puis, à l'aide des outils et méthodes de la lexicométrie, nous aborderons l'analyse elle-même, en esquissant une première caractérisation globale du corpus. Nous finirons par l'étude de quelques cas spécifiques à partir d'une approche thématique.

Etude du Present Perfect anglais à partir de corpus parallèles

Résumé
L’objectif de ce mémoire est d’étudier un phénomène linguistique qui s’appelle «The Present Perfect Puzzle » à travers l’analyse d’un corpus parallèle anglais – français de 15Mo.

Pour illustrer ce phénomène, rappelons qu’à la différence du Passé composé français, le Present Perfect anglais ne peut pas apparaître avec les adverbes ponctuels. Un alignement de corpus dans les deux langues permettra d’étudier les cas précis de ce phénomène et de déterminer quels groupes d’adverbes peuvent apparaître avec ce temps dans chaque langue.

A l’aide de programmes créés en langage « perl », j’ai normalisé le corpus et j’en ai extrait toutes les phrases contenant plus particulièrement des adverbes temporels, y compris les expressions adverbiales. Le résultat de l’extraction comprend désormais deux fichiers, un pour chaque langue. Les phrases extraites sont alignées dans une interface Access pour permettre l’analyse linguistique proprement dite.

Passage de données non structurées à des données structurées : les relations entre entités nommées

Résumé
Les études et méthodes qui assurent une cohérence entre textes et modèles de représentation du contenu textuel relèvent un enjeu de plus en plus important. Le nombre de travaux en industrie et en Recherche et Développement sur ce sujet en atteste. Avec l'explosion de la numérisation des documents et de leur diffusion avec Internet au sein d'une société désormais dite de l'information ou de la connaissance, la necéssité de répondre à une demande de plus en plus forte dans l'industrie et chez les particuliers se fait sentir.

Le travail présenté ici est d'ordre technique et méthodologique. Il s'agit de détecter les relations sémantiques entre entités nommées par des traitements issus du Traitement Automatique des Langues, sur de larges corpus plus ou moins techniques et de les organiser sous une représentation formelle structurée. Sans exclure les phénomènes linguistiques qui peuvent être génériques à tout type de texte, nous nous appuyons sur une méthodologie qui permet de trouver la réalisation des relations dans un corpus spécifique à un domaine, notamment en se concentrant sur la recherche de marqueurs discriminants. Nous considérons donc qu'il existe une forte dépendance entre les membres du triplets corpus/relation/marqueur.