Josiah02 发表于 2024-10-24 13:58:20

采样算法可以给人工智能生成的文本添加“水印”,以显示其来源

本周《自然》杂志介绍了一种可以给大型语言模型生成的文本加水印的工具,提高了其识别和追踪合成内容的能力。
大型语言模型 (LLM) 是广泛使用的人工智能(AI) 工具,可以为聊天机器人、写作支持和其他目的生成文本。然而,识别和将 AI 生成的文本归因于特定来源可能很困难,这使信息的可靠性受到质疑。水印已被提议作为此问题的解决方案,但由于生产系统中严格的质量和计算效率要求,尚未大规模部署。
Sumanth Dathathri、Pushmeet Kohli 及其同事开发了一种方案,该方案使用一种新颖的采样算法将水印应用于 AI 生成的文本,称为 SynthID-Text。该工具使用采样算法巧妙地偏向 LLM 的词汇选择,插入相关检测软件可以识别的签名。这可以通过“扭曲”途径实现,以略微降低输出质量来改善水印,也可以通过“非扭曲”途径实现,以保持文本质量。
这些水印的可检测性在几个公开可用的模型中进行了评估,与现有方法相比,SynthID-Text 显示出更好的可检测性。还使用 Gemini LLM 从实时聊天互动中获得的近 2000 万条回复评估了文本的质量,结果表明非失真水印模式不会降低文本质量。最后,使用 SynthID-Text对运行 LLM 所需的计算能力的影响微乎其微,从而降低了实施障碍。
作者提醒说,可以通过编辑或改写输出来规避文本水印。然而,这项研究表明,可以为人工智能生成的内容生成文本水印的工具是可行的,这进一步提高了负责任的 LLM 使用的责任感和透明度。

页: [1]
查看完整版本: 采样算法可以给人工智能生成的文本添加“水印”,以显示其来源