Collecte et analyse exploratoire de données issues de Twitter sur le thème de la mobilité

Année
2014
Résumé
L'étude des pratiques de mobilité des voyageurs se fait majoritairement au travers d'enquêtes ou de données quantitatives. Or, les utilisateurs des réseaux sociaux, et notamment de Twitter, sont prompts à partager sur le web leurs habitudes de déplacement et leurs itinéraires ponctuels ou quotidiens. Quels types d'informations peut-on repérer sur Twitter afin de mieux connaître la mobilité, d'un point de vue à la fois géographique et socio-économique ? Ce mémoire, réalisé dans le cadre d'un stage à la Direction de l'Innovation et de la Recherche de la SNCF, présente une stratégie de collecte de tweets en rapport avec la mobilité, ainsi que des analyses thématiques sur le corpus obtenu qui montrent le potentiel de ces données. Ces analyses ont également servi de base pour établir une typologie des tweets "Expérience Voyageur" qui nous permet d'organiser les différents types d'informations que partagent les utilisateurs à travers leurs messages ; à partir de cette typologie, nous avons pu amorcer un travail de classification automatique des tweets. A terme, ce projet pourra être couplé à d'autres travaux d'analyse de données hétérogènes afin de produire de nouveaux indicateurs de l'évolution des pratiques de mobilité.