ChatGPT 的崛起与在线问答平台上公共知识共享的减少有关
PNAS Nexus上发表的一项新研究表明,大型语言模型 (LLM)(如 ChatGPT)的广泛采用已导致 Stack Overflow 等平台上的公共知识共享量大幅下降。该研究强调,在 ChatGPT 发布后的六个月内,这个流行的编程问答网站上的用户活动量减少了 25%,而 ChatGPT 的访问受到限制的类似平台则没有。“法学硕士非常强大,具有很高的价值,对世界产生了巨大的影响。人们开始对他们的未来感到疑惑,”第一作者、复杂性科学中心 (CSH) 副教授 Maria del Rio-Chanona 说道。
“我们的研究假设,人们不是在 Stack Overflow 等公共平台上发布问题并得到答案,因为每个人都可以看到这些问题并从中学习,而是在 ChatGPT 上私下提问。然而,像 ChatGPT 这样的法学硕士也接受了这些开放和公开数据的培训,他们在某种程度上取代了这些数据。那么会发生什么呢?”Del Rio-Chanona 补充道,他也是伦敦大学学院的助理教授、牛津大学马丁学院新经济思维研究所和剑桥大学贝内特公共政策研究所的副研究员。
后果重大
“在我们的研究结果中,我们发现 ChatGPT 发布后 Stack Overflow 上的问题和答案越来越少。这具有相当大的影响。这意味着未来可能没有足够的公共数据来训练模型,”Del Rio-Chanona 警告说。在这项研究中,她与慕尼黑路德维希马克西米利安大学的 Nadzeya Laurentsyeva 以及 CSH 教员兼布达佩斯考文纽斯大学教授 Johannes Wachs 合作。
“Stack Overflow 是一个非常有价值的知识数据库,任何有互联网连接的人都可以访问。全世界的人们都从其他人发布的问题和答案中学习,”Wachs 说。
事实上,即使是像 ChatGPT 这样的人工智能模型,也是在 Stack Overflow 帖子等人类生成的内容上进行训练的。具有讽刺意味的是,人工智能取代人类内容创作将使未来人工智能模型的训练变得更加困难。人们普遍认为,使用人工智能生成的数据来训练新模型效果不佳,这个过程就像复印一份复印件。
从公共部门转向私营部门
研究结果还指出,除了单纯的技术变革之外,还可能影响到我们的经济和社会结构。Del Rio-Chanona 及其同事解释说,随着用户与 ChatGPT 等 LLM 的互动增多,他们可能不太愿意为开放知识平台做出贡献,从而导致有价值的数据从公共存储库转移到私有的 AI 系统。
研究人员认为:“这代表着知识从公共领域向私人领域的重大转移。”他们表示,这也可能加强人工智能先行者的竞争优势,进一步集中知识和经济实力。
所有经验和质量水平
Del Rio-Chanona 和她的同事发现,Stack Overflow 上内容创作的减少影响了所有经验水平的用户,从新手到专家。他们还观察到,根据用户反馈,帖子的质量并没有明显下降,这表明低质量和高质量的贡献都被 LLM 所取代。
此外,研究还显示,Python 和 Javascript 等一些编程语言的发布活动降幅明显高于平台的平均水平。
“结果表明,人们确实在 ChatGPT 而不是 Stack Overflow 上询问有关 Python 和 Javascript(两种最常用的编程语言)的问题,”Del Rio-Chanona 说。
页:
[1]