littérature rabbinique, hébreu, supervision faible, qualité de données, annotation automatique, Snorkel, text reuse, citations, manuscrits, midrash