我们能破译外星语言吗?揭示人工智能如何沟通可能是关键
在 2016 年上映的科幻电影《降临》中,一名语言学家面临着一项艰巨的任务:破译一种由回文短语组成的外星语言,这些短语正着读和倒着读是一样的,用圆形符号书写。当她发现各种线索时,世界各国对这些信息的解读各不相同——有些国家认为它们传达了威胁。如果人类今天陷入这样的境地,我们最好的选择可能是研究人工智能(AI)如何发展语言。
但究竟是什么定义了语言?我们大多数人都使用至少一种语言与周围的人交流,但它是如何产生的?语言学家几十年来一直在思考这个问题,但还没有简单的方法可以找出语言是如何进化的。
语言是短暂的,它在化石记录中没有留下任何可考证的痕迹。与骨头不同,我们无法挖掘出古代语言来研究它们是如何随着时间的推移而发展的。
虽然我们可能无法研究人类语言的真正进化,但模拟或许可以提供一些见解。这就是人工智能发挥作用的地方——一个令人着迷的研究领域,称为新兴通信,我过去三年一直在研究它。
为了模拟语言的演化过程,我们为代理 (AI) 分配了一些需要交流的简单任务,比如一个游戏,其中一个机器人必须引导另一个机器人到达网格上的特定位置,但不向其展示地图。我们 (几乎) 不限制它们能说什么或如何说 — 我们只是给它们分配任务,让它们以自己想要的方式解决。
因为解决这些任务需要代理之间相互交流,所以我们可以研究它们的交流随着时间的推移如何发展,以了解语言如何发展。
类似的实验也曾用在人类身上。想象一下,你是一位英语使用者,与一位非英语使用者配对。你的任务是指导你的搭档从桌子上的一堆物品中拿起一个绿色立方体。
你可以试着用手比划出一个立方体的形状,并指向窗外的草地来表示绿色。随着时间的推移,你们会一起开发出一种原始语言。也许你会为“立方体”和“绿色”创造特定的手势或符号。通过反复的互动,这些即兴的信号会变得更加精致和一致,形成一个基本的交流系统。
人工智能也类似。通过反复试验,它们学会就看到的物体进行交流,而对话伙伴也学会理解这些物体。
但是我们怎么知道它们在说什么呢?如果它们只和人工智能对话伙伴发展这种语言,而不是和我们,我们怎么知道每个词的意思呢?毕竟,一个特定的词可能意味着“绿色”、“立方体”,或者更糟——两者兼而有之。这种解释的挑战是我研究的一个关键部分。
破解密码
理解人工智能语言的任务乍一看似乎几乎不可能完成。如果我尝试用波兰语(我的母语)与只会说英语的合作者交谈,我们无法理解对方的意思,甚至不知道每个单词的开头和结尾。
人工智能语言面临的挑战更大,因为它们可能以与人类语言模式完全不同的方式组织信息。
幸运的是,语言学家已经开发出利用信息论来解释未知语言的复杂 工具。
就像考古学家从碎片中拼凑古代语言一样,我们利用人工智能对话中的模式来理解其语言结构。有时我们会发现与人类语言惊人的相似之处,有时我们会发现全新的交流方式。
这些工具帮助我们窥视人工智能通信的“黑匣子”,揭示人工智能代理如何开发自己独特的信息共享方式。
我最近的工作重点是利用代理看到和说的内容来解释他们的语言。想象一下,你拥有一份用你不熟悉的语言编写的对话记录,以及每个说话者当时所看的东西。我们可以将记录中的模式与参与者视野中的物体相匹配,从而在单词和物体之间建立统计联系。
例如,也许短语“yayo”与一只飞过的鸟重合——我们可以猜测“yayo”是说话者所说的“鸟”。通过仔细分析这些模式,我们可以开始解读交流背后的含义。
在我和同事发表的最新论文中,该论文将发表在神经信息处理系统 (NeurIPS) 的会议论文集上,我们表明这种方法可用于对人工智能的语言和语法的至少部分进行逆向工程,从而让我们深入了解它们如何构建通信。
外星人和自主系统
这与外星人有什么关系?我们正在开发的理解人工智能语言的方法可以帮助我们破译未来的任何外星人通信。
如果我们能够获得一些外星文字以及一些背景信息(例如与文本相关的视觉信息),我们就可以应用相同的统计工具来分析它们。我们今天开发的方法可能成为未来研究外星语言(即外星语言学)的有用工具。
但我们不需要找到外星人才能从这项研究中受益。它有无数的应用,从改进ChatGPT 或 Claude 等语言模型到改善自动驾驶汽车或无人机之间的通信。
通过解码新兴语言,我们可以让未来的技术更容易理解。无论是了解自动驾驶汽车如何协调其行驶,还是人工智能系统如何做出决策,我们不仅仅是在创建智能系统,我们还在学习理解它们。
页:
[1]