L'Equipe de Recherche Textes, Informatique, Multilinguisme (ERTIM) est une équipe de recherche, unité propre de l'Inalco, créée en 2005, qui travaille essentiellement en Traitement Automatique des Langues (TAL, ou NLP en anglais pour Natural Language Processing).
Le TAL, généralement considéré comme un domaine d'application de l'Intelligence Artificielle (IA) fait appel à l'informatique, aux mathématiques, à la linguistique. L'objectif principal est de concevoir ou d'exploiter des moyens (modèles et algorithmes) pour analyser ou générer des données en langues, selon une modalité écrite ou orale. Les tâches spécifiques sont de diverses natures : acquisition et numérisation de données textuelles, modélisations linguistiques ou sémantiques, extraction d'information, fouille de données, traduction automatique, système de dialogue, etc.
L'ERTIM s'intéresse plus particulièrement aux questions méthodologiques (collecte de données, numérisation, annotation, évaluation qualitative ou quantitative) dans des contextes fortement multilingues, avec un intérêt marqué pour les langues peu dotées du domaine de l'Inalco. Les activités de l'équipe sont déclinées selon quatre axes : humanités numériques, diversité des langues, méthodologie du TAL, acquisition de l'information linguistique.