Josiah02 发表于 2024-10-11 16:38:47

苹果推出 Depth Pro,一款可以绘制 2D 图像深度的 AI 应用程序

苹果公司的一个工程师团队开发了一种基于人工智能的模型,名为 Depth Pro,可以绘制 2D 图像的深度。该团队撰写了一篇论文,描述了该应用程序及其功能,并将其发布在arXiv预印本服务器上。他们还在公司的机器学习研究页面上发布了有关该应用程序的公告。
人类和其他动物之所以能够感知深度,是因为大脑能够拍摄两幅图像,每只眼睛分别拍摄一幅,然后利用两幅图像之间的差异来判断图像中哪些部分更近,哪些部分更远。一些摄像机也做了类似的事情来制作 3D 视频。
由于智能手机仅依靠一个摄像头来拍照和制作视频,因此可以添加各种硬件和软件附件,以增加一定程度的深度。在这项新尝试中,苹果的工程师使用原始图像中的数据创建了整个深度图,而无需使用相机固有参数等元数据。
深度图是使用原始图像中的所有像素创建的图。图上的每个数据点代表一个像素,并对应于像素所代表的图片部分与被成像物体的相应部分之间的距离。
这样的地图可以为平面图片添加另一个维度,使其具有 3D 效果。该团队表示,创建深度地图可以产生比使用标准智能手机技术制作的 3D 效果更清晰的效果。
苹果团队在公告中声称,使用该模型的应用程序在具有标准 GPU 的计算机上运行时仅需 0.3 秒便可生成深度图,而且无需通常生成 3D 效果所需的相机数据类型。
通过创建如此快速运行的模型,苹果开启了实时使用单镜头相机创建 3D 图像的大门。该团队指出,这可能会对机器人和其他实时地图绘制应用(例如自动驾驶汽车上使用的应用)产生重大影响。

页: [1]
查看完整版本: 苹果推出 Depth Pro,一款可以绘制 2D 图像深度的 AI 应用程序