OpenAI 推出 sCM,这是一种新模型,其视频媒体生成速度比当前扩散模型快 50 倍
OpenAI 团队的两位专家开发了一种新型连续时间一致性模型 (sCM),他们声称该模型可以比目前使用的模型快 50 倍生成视频媒体。程璐和杨松在arXiv预印本服务器上发表了一篇介绍其新模型的论文。他们还在公司网站上发布了一篇介绍性论文。在训练人工智能应用程序的机器学习方法中,扩散模型(有时称为扩散概率模型或基于分数的生成模型)是一种变量生成模型。
此类模型通常包含三个主要部分:正向和反向过程以及采样过程。这些模型是生成基于视觉的产品(例如视频或静态图像)的基础,但它们也已用于其他应用,例如音频生成。
与其他机器学习模型一样,扩散模型通过对大量数据进行采样来工作。大多数此类模型执行数百个步骤来生成最终产品,这就是为什么大多数模型需要花一些时间才能完成任务。
与之形成鲜明对比的是,Lu 和 Song 开发了一种模型,它仅用两个步骤就能完成所有工作。他们指出,步骤的减少大大减少了模型生成视频所需的时间,而且质量没有任何损失。
新模型使用了超过 15 亿个参数,可以在配备单个 A100 GPU 的机器上以极短的时间生成样本视频。这比目前使用的模型快约 50 倍。
研究人员指出,他们的新模型所需的计算能力比其他模型要少得多,这也是随着人工智能应用使用量的激增,人工智能应用普遍存在的一个问题。他们还指出,他们的新方法已经经过了基准测试,以将其结果与其他模型进行比较,包括当前使用的模型和其他团队正在开发的模型。他们认为,他们的模型应该在不久的将来能够实现实时生成人工智能应用。
页:
[1]