多任务学习模型增强仇恨言论识别

Josiah02 · 发表于 2024-10-15 11:18:18

研究人员开发出了一种新方法，使用一种新的多任务学习 (MTL) 模型（一种可跨多个数据集工作的机器学习模型）更准确、更一致地自动检测社交媒体平台上的仇恨言论。
网络上恶意仇恨言论的传播会加深政治分歧、边缘化弱势群体、削弱民主并引发现实世界的危害，包括增加国内恐怖主义的风险。
悉尼科技大学 (UTS) 行为数据科学实验室主任 Marian-Andrei Rizoiu 副教授在打击网络虚假信息和仇恨言论方面处于前线。他的跨学科研究结合了计算机和社会科学，旨在更好地理解和预测人们在网络环境中的注意力，包括影响和分化数字渠道舆论的言论类型。
“随着社交媒体成为我们日常生活的重要组成部分，自动识别仇恨和辱骂内容对于打击有害内容的传播和防止其破坏性影响至关重要，”Rizoiu 副教授说。
“设计有效的仇恨言论自动检测系统是一项重大挑战。目前的模型在识别所有不同类型的仇恨言论方面效果不佳，包括种族主义、性别歧视、骚扰、煽动暴力和极端主义。
“这是因为当前的模型仅在数据集的一部分上进行训练，并在同一数据集上进行测试。这意味着当他们面对新的或不同的数据时，他们可能会遇到困难并且表现不稳定。”
Rizoiu 副教授在论文《利用多任务学习推广仇恨言论检测：以政治公众人物为例》中概述了新模型，该论文发表在《计算机语音与语言》杂志上，合著者兼 UTS 博士候选人 Lanqin Yuan 也参与了该论文的撰写。
多任务学习模型能够同时执行多项任务，并在数据集之间共享信息。在本例中，该模型使用来自 Twitter（现为 X）、Reddit、Gab 和新纳粹论坛 Stormfront 等平台的八个仇恨言论数据集进行训练。
随后，MTL 模型在一个独特的数据集上进行了测试，该数据集包含 15 位美国公众人物的 300,000 条推文，这些公众人物包括前总统、保守派政治家、极右翼阴谋论者、媒体评论员以及被认为非常进步的左倾代表。
分析显示，辱骂和充满仇恨的推文，通常带有厌女症和仇视伊斯兰教的色彩，主要来自右翼人士。具体来说，在 5,299 条辱骂性帖子中，有 5,093 条是由右翼人士发布的。
“仇恨言论这一概念并不容易量化。它与攻击性言论以及欺凌和骚扰等其他辱骂性内容是连续的，”里佐尤说。
联合国将仇恨言论定义为“以任何言语、文字或行为形式进行的交流，基于个人或群体的身份”，包括其宗教、种族、性别或其他身份因素，对个人或群体进行攻击或使用贬义或歧视性语言。
MTL 模型能够将辱骂性言论与仇恨言论区分开来，并识别特定主题，包括伊斯兰教、妇女、种族和移民。

账号		自动登录	找回密码
密码			立即注册