采样算法可以给人工智能生成的文本添加“水印”，以显示其来源

Josiah02 · 发表于 2024-10-24 13:58:20

本周《自然》杂志介绍了一种可以给大型语言模型生成的文本加水印的工具，提高了其识别和追踪合成内容的能力。
大型语言模型 (LLM) 是广泛使用的人工智能(AI) 工具，可以为聊天机器人、写作支持和其他目的生成文本。然而，识别和将 AI 生成的文本归因于特定来源可能很困难，这使信息的可靠性受到质疑。水印已被提议作为此问题的解决方案，但由于生产系统中严格的质量和计算效率要求，尚未大规模部署。
Sumanth Dathathri、Pushmeet Kohli 及其同事开发了一种方案，该方案使用一种新颖的采样算法将水印应用于 AI 生成的文本，称为 SynthID-Text。该工具使用采样算法巧妙地偏向 LLM 的词汇选择，插入相关检测软件可以识别的签名。这可以通过“扭曲”途径实现，以略微降低输出质量来改善水印，也可以通过“非扭曲”途径实现，以保持文本质量。
这些水印的可检测性在几个公开可用的模型中进行了评估，与现有方法相比，SynthID-Text 显示出更好的可检测性。还使用 Gemini LLM 从实时聊天互动中获得的近 2000 万条回复评估了文本的质量，结果表明非失真水印模式不会降低文本质量。最后，使用 SynthID-Text对运行 LLM 所需的计算能力的影响微乎其微，从而降低了实施障碍。
作者提醒说，可以通过编辑或改写输出来规避文本水印。然而，这项研究表明，可以为人工智能生成的内容生成文本水印的工具是可行的，这进一步提高了负责任的 LLM 使用的责任感和透明度。

账号		自动登录	找回密码
密码			立即注册