研究表明，人工智能生成的图像描绘了理想化的年轻人

Josiah02 · 发表于 2024-10-17 23:55:08

如果你已经使用人工智能一段时间了，你可能会注意到它创建的文本和图像可能有点普通和粗糙。有些人会说它们没有灵魂。
或者，正如阿格德大学的 Gunhild Kvåle 教授所说，“ChatGPT 的声音让我有一种奇怪的感觉。”
她与瑞典厄勒布鲁大学的同事古斯塔夫·韦斯特伯格 (Gustav Westberg) 一起研究了人工智能工具 Dall-E 3 如何创建青少年图像。Dall-E 是 ChatGPT 内置的图像生成器。
这项研究的目标之一就是找出这种痒感的来源，该研究现已发表在《话语与社会》上。是什么造成了人工智能图像的这种人为特质？他们发现这些图像有四个共同特征。研究人员认为，其中一些特征值得担忧。
表面层次的多样性
“令人惊讶的是，一方面，Dall-E 关注种族和性别的多样性，而另一方面，图像的多样性却不够，”Kvåle 说。
为了获得具有代表性且可以进行比较的图像样本，研究人员提供了“创建青少年图像”等一般指令。他们还要求人工智能生成自己的文本提示来创建图像。
“你可以看到，图片中的青少年应该代表不同的种族。当 ChatGPT 自己编写提示时，多样性的强调程度也非常引人注目，”Kvåle 说。
这表明该技术背后的公司已经接受了有关之前版本缺乏多样性的批评。
但 Kvåle 表示，“照片中的年轻人惊人地相似。他们都穿着牛仔裤和匡威鞋，长相漂亮，五官精致，头发浓密，而且没有一个人脸上有痘痘。这是年轻、成功、美丽的青少年这一特定社会群体。”
幸福可以带来销量
另一个共同点是这些图片都非常积极。这些年轻人在一起学习、听音乐会、烤棉花糖，或者——荒谬的是——一起在当地社区花园里合作。
“照片中的每个人都很开心，没有人悲伤。他们从事社会重视的活动。但没有一张照片显示他们在工作或睡觉。这是上层中产阶级年轻人的休闲时间，”Kvåle 说。
这种正面的描绘也包含了一些规范。所有人都很瘦，即使直接的提示也无法改变这一点。
“技术为人们可以创造哪些类型的图像设定了明确的界限。虽然意图是好的，但这并不完全是积极的。我们可以在我们生活的文化背景下看到这一点，我们分享的文字和图像不仅是为了客观地传达信息，也是为了宣传自己。”
几乎真实，但不完全真实
Kvåle 指出，光线以及物体在前景或背景的摆放方式都模仿了摄影。这是他们发现的第三个共同特征。
图片中描绘的场景多种多样，有公园、青年俱乐部、音乐会舞台和凌乱的青少年卧室。
“这些照片给人一种真实的印象，但通过背景，这些年轻人也有社会地位。他们从未出现在与社会问题相关的工作或城市环境中，”她说。
想象力的局限性
研究人员的第四个发现是人工智能如何展示富有想象力的场景，例如年轻人在北极的雪球里滑冰。
然而，这不是 Dall-E 的常态，这是你必须特别要求的事情。
“Dall-E 显然更喜欢照片级逼真的图像。有时它们会变成图形插图，但照片级逼真显然是标准，”Kvåle 解释道。
批判意识
像 Dall-E 3 这样的图像生成器已经非常熟练，并且人人都能使用。然而，我们并没有被人工智能生成的图像淹没。事实上，据 Kvåle 称，人工智能生成的图像出奇地少。
“有人说人工智能会改变一切，但这显然不是事实。新闻编辑室、传播部门和机构都有行业标准。并不是所有事情都会因为有可能而一夜之间改变，”她说。
与此同时，研究人员对图像的相似程度感到惊讶。
“像 Dall-E 这样的服务可以对我们的视觉文化产生很大的影响。我们有责任对这些图像保持批判意识，因为它们并不代表我们希望社会呈现的样子，”Kvåle 说道，并总结道：
“这让世界变得有点无聊。”

账号		自动登录	找回密码
密码			立即注册