研究探讨法学硕士学位对人类创造力的影响
大型语言模型 (LLM) 是一种能够处理人类语言并根据书面提示生成新文本的人工智能系统,如今已被世界各地的人们广泛用于完成各种任务。这些系统可用于快速创建各种特定用途的文本,包括工作电子邮件、报告、列表、文章和散文,以及诗歌、故事、剧本甚至歌词。有些人将法学硕士作为灵感或想法的来源,然后用自己的语言加以改编,而另一些人则可能选择直接使用人工智能生成的文本而不做任何修改。尽管它们作为创意工具总体上很有效,但它们对人类创造力的实际影响仍不太为人所知。
多伦多大学的研究人员最近开始探索在创造性任务中使用法学硕士如何影响人类用户的创造力。他们的研究结果发表在arXiv预印本服务器上,表明这些模型可能会削弱人类的创造性思维能力,导致创意的多样性和创新性降低。
该论文的共同作者哈什·库马尔 (Harsh Kumar) 告诉 Tech Xplore: “生成式 AI 工具(例如 ChatGPT)越来越多地被用于创造性任务,从撰写电子邮件到集思广益。”
“然而,人们越来越担心这些工具对人类创造力的长期影响,但尚未得到足够的重视。我们假设,尽管在使用该工具时可以提高性能,但反复使用大型语言模型(LLM) 可能会削弱我们独立进行创造性思考的能力——类似于运动中服用提高性能的类固醇提供的暂时性提升。”
Kumar 及其同事最近进行的研究的主要目标是在实验环境中测量 LLM 使用对人类用户创造力的残留影响。为此,他们进行了两项实验,重点关注人类创造力的不同方面,即发散思维和聚合思维。
“每个实验的任务都改编自现有的心理学文献,”库马尔解释道。“在发散思维实验中,参与者被要求在每一轮中为给定的物体想出其他用途,而在聚合思维实验中,他们会看到三个单词,并被要求找到第四个单词来连接它们(例如,‘书’连接‘架子’、‘原木’和‘蠕虫’)。”
第一和第二个实验都分为两个不同的阶段:暴露阶段和测试阶段。在暴露阶段,实验条件下的参与者使用 GPT-4o(由 OpenAI 开发的广泛使用的对话式 LLM)获得特定问题的答案。
GPT-4o 收到的回复与当前任务相关。对于发散思维任务,GPT-4o 提供了相关的想法列表,而对于聚合思维任务,它生成了一个单词,将提供给参与者的三个单词联系起来。
“我们还探索了该模型作为教练的潜力,通过提供结构化的思考框架而不是直接提供解决方案,”Kumar 说。“在控制条件下,参与者无法获得 LLM 的帮助。在测试阶段,所有参与者都独立完成任务,这使我们能够衡量在暴露轮次中使用 LLM 的残留效应。”
研究人员发现,在两项实验中,使用 GPT-4o 提高了参与者在暴露阶段的表现。然而有趣的是,最初没有使用 GPT-4o 的参与者被发现比在测试阶段使用该模型的参与者表现更好。
“这表明,基于 LLM 的创造力工具的设计者以及 LLM 的开发者不仅应考虑使用 LLM 的直接好处,还应考虑其对用户认知能力的潜在长期影响,”Kumar 说道。“否则,这些工具可能会随着时间的推移无意中导致认知能力下降。我们还观察到,与现有文献一致,在接触过程中使用 LLM 产生的想法可能会导致群体内的想法同质化。”
研究人员还惊讶地发现,之前报告的同质化效应(即 LLM 用户报告的随着时间的推移产生更少多样性想法的趋势)即使在参与者停止使用 GPT-4o 后仍然存在。当模型为他们提供一个旨在在实验的暴露阶段指导他们思考的通用结构化框架时,这种持续效应尤其突出。
总体而言,Kumar 及其同事收集到的研究结果提供了一些宝贵的见解,可以指导未来开发 LLM 和 AI 驱动的创意工具的努力。到目前为止,该团队一直在受控的实验室环境中进行实验,参与者只在有限的时间内接触 GPT-4o,但他们很快计划在更现实的场景中进行更多研究。
“现实世界的情况更加复杂,需要长时间的接触,”库马尔补充道。“为了解决这个问题,我们计划进行实地实验,进行更自然的任务,比如写一个有创意的故事。
“此外,我们认为思想同质化问题十分严重,对文化和社会有着长期的负面影响。下一步,我们打算探索可以减轻思想同质化的 LLM 代理的设计。”
页:
[1]