找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

只需一步,快速开始

查看: 21|回复: 0

采样算法可以给人工智能生成的文本添加“水印”,以显示其来源

[复制链接]

2733

主题

0

回帖

5466

积分

管理员

积分
5466
发表于 2024-10-24 13:58:20 | 显示全部楼层 |阅读模式 IP归属地:亚太地区
本周《自然》杂志介绍了一种可以给大型语言模型生成的文本加水印的工具,提高了其识别和追踪合成内容的能力。
大型语言模型 (LLM) 是广泛使用的人工智能(AI) 工具,可以为聊天机器人、写作支持和其他目的生成文本。然而,识别和将 AI 生成的文本归因于特定来源可能很困难,这使信息的可靠性受到质疑。水印已被提议作为此问题的解决方案,但由于生产系统中严格的质量和计算效率要求,尚未大规模部署。
Sumanth Dathathri、Pushmeet Kohli 及其同事开发了一种方案,该方案使用一种新颖的采样算法将水印应用于 AI 生成的文本,称为 SynthID-Text。该工具使用采样算法巧妙地偏向 LLM 的词汇选择,插入相关检测软件可以识别的签名。这可以通过“扭曲”途径实现,以略微降低输出质量来改善水印,也可以通过“非扭曲”途径实现,以保持文本质量。
这些水印的可检测性在几个公开可用的模型中进行了评估,与现有方法相比,SynthID-Text 显示出更好的可检测性。还使用 Gemini LLM 从实时聊天互动中获得的近 2000 万条回复评估了文本的质量,结果表明非失真水印模式不会降低文本质量。最后,使用 SynthID-Text对运行 LLM 所需的计算能力的影响微乎其微,从而降低了实施障碍。
作者提醒说,可以通过编辑或改写输出来规避文本水印。然而,这项研究表明,可以为人工智能生成的内容生成文本水印的工具是可行的,这进一步提高了负责任的 LLM 使用的责任感和透明度。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|NewCET |网站地图

GMT+8, 2024-11-17 04:59 , Processed in 0.025697 second(s), 21 queries .

Powered by NewCET 1.0

Copyright © 2012-2024, NewCET.

快速回复 返回顶部 返回列表