littérature rabbinique, hébreu, supervision faible, qualité de données, annotation automatique, Snorkel, text reuse, citations, manuscrits, midrash https://ertim.inalco.fr/ fr Détecter les citations bibliques dans la Mekhilta de Rabbi Yishmael : un cas d’étude pour la supervision faible https://ertim.inalco.fr/node/755 <span class="field field--name-title field--type-string field--label-hidden">Détecter les citations bibliques dans la Mekhilta de Rabbi Yishmael : un cas d’étude pour la supervision faible</span> <span class="field field--name-uid field--type-entity-reference field--label-hidden"><span>gestionnaire</span></span> <span class="field field--name-created field--type-created field--label-hidden">ven 19/07/2024 - 13:06</span> <div class="field field--name-field-auteur field--type-string field--label-above"> <div class="field__label">Auteur</div> <div class="field__item">Nicolas Bontemps</div> </div> <div class="field field--name-field-annee field--type-integer field--label-above"> <div class="field__label">Année</div> <div class="field__item">2023</div> </div> <div class="field field--name-field-abstract field--type-string-long field--label-above"> <div class="field__label">Résumé</div> <div class="field__item">La détection des citations bibliques utilisées dans les commentaires rabbiniques médiévaux constitue un défi, tant par les caractéristiques de ces textes que par la difficulté d’accès à des corpus annotés pour l’apprentissage automatique. L’ambition de ce travail est d&#039;évaluer la capacité de la supervision faible à générer efficacement un tel type de données. Pour cela, nous étudierons un midrash daté des environs des IIe-IIIe siècles, la Mekhilta de Rabbi Yishmael. L’exploration de la Mekhilta de Rabbi Yishmael nous permettra de définir un ensemble de règles heuristiques que nous combinerons avec d’autres ressources au travers de l’utilisation de la bibliothèque Python Snorkel dédiée à la supervision faible. Nous démontrerons ici l’efficacité de cet outil pour résoudre notre problème, ainsi que ses performances dans des cas mêlant des sources plus ou moins fiables. Cette étude prépare le terrain en vue de l’élaboration d’un modèle qui généralisera la détection de citations bibliques à l’ensemble de la littérature rabbinique.</div> </div> <div class="field field--name-field-tags field--type-entity-reference field--label-above"> <div class="field__label">Mots-clés</div> <div class="field__items"> <div class="field__item"><a href="/taxonomy/term/2689" hreflang="fr">littérature rabbinique, hébreu, supervision faible, qualité de données, annotation automatique, Snorkel, text reuse, citations, manuscrits, midrash</a></div> </div> </div> <div class="field field--name-field-document field--type-file field--label-above"> <div class="field__label">Fichier</div> <div class="field__item"> <span class="file file--mime-application-pdf file--application-pdf"> <a href="/sites/default/files/nbontemps_me%E2%95%A0%C3%BCmoire_M2TAL_V2.pdf" type="application/pdf">nbontemps_me╠ümoire_M2TAL_V2.pdf</a></span> </div> </div> Fri, 19 Jul 2024 11:06:33 +0000 gestionnaire 755 at https://ertim.inalco.fr