替代模型可以通过处理文本和视觉数据来识别假新闻
互联网的出现改变了人们获取和分享信息的方式,让恶意人士更容易传播有偏见、不可靠或虚假的新闻。最近的技术进步,包括可以生成逼真的文本、录音和图像的人工智能 (AI) 模型,进一步助长了这股虚假信息的浪潮。近年来,区分真假新闻变得越来越困难,这为无知、混乱和两极分化提供了完美的温床。因此,开发有效的工具来快速识别和删除热门网站和搜索引擎上的网络假新闻至关重要。
国立阳明交通大学、中华大学和国立宜兰大学的研究人员最近开发了一种新的多模态模型,可以帮助快速检测网络假新闻。该模型在《科学进展》发表的一篇论文中介绍,可以通过处理文本和视觉数据(而不是单一类型的数据)来识别假新闻。
Szu-Yin Lin、Yen-Chiu Chen 及其同事在论文中写道:“现有文献主要侧重于分析假新闻中的个体特征,忽视了多模态特征融合识别。”
“与单模态方法相比,多模态融合可以更全面、更丰富地从不同数据模态(如文本和图像)中捕获信息,从而提高模型的性能和有效性。本研究提出了一种使用多模态融合识别虚假新闻的模型,旨在遏制错误信息。”
为了提高虚假新闻检测能力,林、陈和他们的同事着手开发一种替代模型,该模型可以同时分析在线新闻的文本和视觉特征。他们开发的模型首先清理数据,然后从干净的数据中提取这些特征。
研究人员的模型使用各种融合策略整合了文本和视觉信息,包括早期融合、联合融合和后期融合技术。在初步测试中,这种多模态方法表现优异,检测假新闻的效果优于成熟的单模态技术(包括 BERT)。
该团队的多模态模型在 Gossopcop 和 Fakeddit 数据集上进行了测试,这两个数据集通常用于训练假新闻检测模型。此前发现,在这两个数据集上,单模态模型检测假新闻的准确率不尽如人意,分别为 72% 和 65%。
“所提出的框架在分类之前通过数据清理和特征提取来处理文本和视觉信息,”林、陈和他们的同事写道。“虚假新闻分类是通过一个模型完成的,该模型在 Gossipcop 和 Fakeddit 数据集中的准确率分别为 85% 和 90%,F1 得分分别为 90% 和 88%,展示了其性能。
“该研究展示了不同训练期的成果,证明了多模态融合在结合文本和图像识别打击虚假新闻方面的有效性。”
林、陈和他的同事们收集到的这些令人鼓舞的发现凸显了多模态融合模型在假新闻检测方面的潜力。因此,他们可以鼓励其他团队开发依赖于多种模态的类似模型。
未来,新模型还可以在更多数据集和真实数据上进行测试。最终,它可以为全球应对和减少网络虚假信息的努力做出贡献。
页:
[1]