textométrie https://ertim.inalco.fr/ fr Définition d'un modèle d'émotions pour la catégorisation de textes narratifs courts https://ertim.inalco.fr/node/575 <span class="field field--name-title field--type-string field--label-hidden">Définition d&#039;un modèle d&#039;émotions pour la catégorisation de textes narratifs courts</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2014</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Les plates-formes communautaires relatives à l&#039;industrie culturelle sont aujourd&#039;hui largement répandues. Si les plus connues d&#039;entre elles concernent la musique ou les vidéos, certaines innovent et cherchent à exploiter le domaine de la littérature. Ainsi, Short Edition se présente comme l&#039;éditeur communautaire de la littérature courte. Bien que le domaine soit novateur et les acteurs présents peu nombreux, la concurrence est déjà forte et la course à l&#039;innovation fait rage. Dans ce contexte, Short Edition cherche à explorer de nouvelles voies, comme celle qui nous intéresse : la classification automatique des textes du site selon les émotions. Afin d&#039;atteindre cet objectif, il est nécessaire de mettre en place un processus d&#039;annotation manuelle des textes d&#039;après un modèle original et encadré par des directives spécialement conçues. Les enjeux et les contraintes de ce projet sont multiples et complexes : projet novateur ne pouvant donc pas s&#039;appuyer entièrement sur des travaux antérieurs, recours à des annotateurs bénévoles ayant pour effet de limiter les possibilités d&#039;action, pluridisciplinarité de la problématique. Ce mémoire présente le travail réalisé dans le cadre de ce projet. Après avoir réalisé un état de l&#039;art, nous présentons Short Edition et les données d&#039;étude. Nous définissons ensuite un nouveau modèle et ses paramètres, ainsi que les documents et interfaces nécessaires au processus d&#039;annotation. Enfin, nous procédons à la validation du modèle construit par une étude textométrique.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2338" hreflang="fr">emotions</a></div> <div class="field__item"><a href="/taxonomy/term/2339" hreflang="fr">textes littéraires</a></div> <div class="field__item"><a href="/taxonomy/term/2340" hreflang="fr">édition numérique</a></div> <div class="field__item"><a href="/taxonomy/term/1845" hreflang="fr">textométrie</a></div> <div class="field__item"><a href="/taxonomy/term/2341" hreflang="fr">modèle émotionnel</a></div> <div class="field__item"><a href="/taxonomy/term/2342" hreflang="fr">processus d&#039;annotation</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoire_gianola_emotions.pdf" type="application/pdf">memoire_gianola_emotions.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 575 at https://ertim.inalco.fr Études contextuelles des émissions avant les publicités de la télé (DRTV) pour augmenter la performance des plans d'achat https://ertim.inalco.fr/node/571 <span class="field field--name-title field--type-string field--label-hidden">Études contextuelles des émissions avant les publicités de la télé (DRTV) pour augmenter la performance des plans d&#039;achat</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2014</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Au cours du projet de ce mémoire, nous allons étudier l’impact des écrans publicitaires sur le trafic des sites e-commerces. À ces écrans sont associés certains types d’information, comme les émissions avant et après le passage de l’écran publicitaire. Chacune de ces informations peut impacter la performance de ces écrans. Dans un premier temps, le but de ce mémoire est de présenter un modèle prédictif de la performance des écrans publicitaires par le biais des émissions, avant ou après le passage de ceux-ci. Dans un second temps, nous nous pencherons sur la description de ces émissions pour mettre l’accent sur l’analyse des mots utilisés. Enfin, nous verrons s’il existe un lien établi entre le contexte de l’émission et la réussite de ces écrans.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2321" hreflang="fr">campagne publicitaire</a></div> <div class="field__item"><a href="/taxonomy/term/2322" hreflang="fr">ecran publicitaire</a></div> <div class="field__item"><a href="/taxonomy/term/2323" hreflang="fr">spot télé</a></div> <div class="field__item"><a href="/taxonomy/term/2324" hreflang="fr">drtv</a></div> <div class="field__item"><a href="/taxonomy/term/2325" hreflang="fr">réseaux de neurones</a></div> <div class="field__item"><a href="/taxonomy/term/2326" hreflang="fr">perceptron</a></div> <div class="field__item"><a href="/taxonomy/term/1845" hreflang="fr">textométrie</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/memoire_final.pdf" type="application/pdf">memoire_final.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 571 at https://ertim.inalco.fr Collecte et analyse exploratoire de données issues de Twitter sur le thème de la mobilité https://ertim.inalco.fr/node/567 <span class="field field--name-title field--type-string field--label-hidden">Collecte et analyse exploratoire de données issues de Twitter sur le thème de la mobilité</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2014</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">L&#039;étude des pratiques de mobilité des voyageurs se fait majoritairement au travers d&#039;enquêtes ou de données quantitatives. Or, les utilisateurs des réseaux sociaux, et notamment de Twitter, sont prompts à partager sur le web leurs habitudes de déplacement et leurs itinéraires ponctuels ou quotidiens. Quels types d&#039;informations peut-on repérer sur Twitter afin de mieux connaître la mobilité, d&#039;un point de vue à la fois géographique et socio-économique ? Ce mémoire, réalisé dans le cadre d&#039;un stage à la Direction de l&#039;Innovation et de la Recherche de la SNCF, présente une stratégie de collecte de tweets en rapport avec la mobilité, ainsi que des analyses thématiques sur le corpus obtenu qui montrent le potentiel de ces données. Ces analyses ont également servi de base pour établir une typologie des tweets &quot;Expérience Voyageur&quot; qui nous permet d&#039;organiser les différents types d&#039;informations que partagent les utilisateurs à travers leurs messages ; à partir de cette typologie, nous avons pu amorcer un travail de classification automatique des tweets. A terme, ce projet pourra être couplé à d&#039;autres travaux d&#039;analyse de données hétérogènes afin de produire de nouveaux indicateurs de l&#039;évolution des pratiques de mobilité.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2310" hreflang="fr">Twitter</a></div> <div class="field__item"><a href="/taxonomy/term/2311" hreflang="fr">mobilité</a></div> <div class="field__item"><a href="/taxonomy/term/1845" hreflang="fr">textométrie</a></div> <div class="field__item"><a href="/taxonomy/term/2312" hreflang="fr">analyse qualitative</a></div> <div class="field__item"><a href="/taxonomy/term/2313" hreflang="fr">transports</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/amelie-martin_memoireVFinale.pdf" type="application/pdf">amelie-martin_memoireVFinale.pdf</a></span> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 567 at https://ertim.inalco.fr Extraction d’un lexique français-anglais relatif à la sécurité internationale à partir d’un corpus parallèle https://ertim.inalco.fr/node/107 <span class="field field--name-title field--type-string field--label-hidden">Extraction d’un lexique français-anglais relatif à la sécurité internationale à partir d’un corpus parallèle</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Pichon</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2007</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Le propos de cette expérimentation est d’établir un lexique français – anglais à l’aide d’outils textométriques.<br /> <br /> Après une brève exploration des méthodes de textométrie pure dans une optique d’extraction terminologique, cette expérimentation portera plus particulièrement sur une approche hybride alliant textométrie et filtrage morphosyntaxique. Il sera alors procédé à un étiquetage morphosyntaxique du texte source afin d’effectuer sur celui-ci une extraction de syntagmes français selon des patrons morpho-syntaxiques choisis.<br /> <br /> Des termes relevant du domaine de la sécurité internationale seront ensuite sélectionnés parmi ces instances de patrons français puis leurs équivalents traductionnels seront recherchés dans le texte cible anglais, préalablement aligné au texte source français.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1894" hreflang="fr">extraction de candidats termes</a></div> <div class="field__item"><a href="/taxonomy/term/1837" hreflang="fr">corpus parallèle</a></div> <div class="field__item"><a href="/taxonomy/term/1895" hreflang="fr">alignement</a></div> <div class="field__item"><a href="/taxonomy/term/1845" hreflang="fr">textométrie</a></div> <div class="field__item"><a href="/taxonomy/term/1896" hreflang="fr">filtrage à l’aide de patrons morpho-syntaxiques</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 107 at https://ertim.inalco.fr Approche textométrique de l’analyse de la presse : la Russie selon « Le Monde » https://ertim.inalco.fr/node/94 <span class="field field--name-title field--type-string field--label-hidden">Approche textométrique de l’analyse de la presse : la Russie selon « Le Monde »</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>Anonyme (non vérifié)</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 06/11/2020 - 00:00</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Semenova</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2006</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">Ce travail vise à étudier les représentations thématiques de la Russie dans la version électronique du journal &quot;Le Monde&quot;.<br /> <br /> Nous avons élaboré un procédé textométrique d’analyse de la presse qui pourrait être facilement généralisé à d’autres types de corpus journalistiques.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/1843" hreflang="fr">corpus</a></div> <div class="field__item"><a href="/taxonomy/term/1844" hreflang="fr">presse</a></div> <div class="field__item"><a href="/taxonomy/term/1845" hreflang="fr">textométrie</a></div> <div class="field__item"><a href="/taxonomy/term/1839" hreflang="fr">segmentation</a></div> <div class="field__item"><a href="/taxonomy/term/1846" hreflang="fr">Lexico 3</a></div> </div> </div> Thu, 05 Nov 2020 23:00:00 +0000 Anonyme 94 at https://ertim.inalco.fr