Hate speech detection in social media
Résumé
Avec la popularité des plates-formes de réseaux sociaux, de plus en plus de personnes sont connectées et partagent des informations. Bien que nous profitions de cet environnement ouvert, nous devrions également envisager l'un des dommages potentiels qu'il entraîne: le discours de haine en ligne. Détecter le discours de haine a été un défi pour le traitement du langage naturel. Ici, nous construisons et comparons 8 modèles traditionnels d’apprentissage automatique avec des réseaux de neurones. Il s’avère que notre modèle construit sur le transformateur BERT atteint la plus haute précision de 0,93. Nous analysons des méthodes détaillées et quelques problèmes actuels de la définition et de l’ensemble de données.