人工智能系统和大型语言模型 (LLM) 需要使用大量数据进行训练才能准确无误,但它们不应使用无权使用的数据进行训练。OpenAI上周与 The Atlantic 和 Vox 达成的许可协议表明,双方都有兴趣达成这些人工智能训练内容许可协议。 Human Native AI 是一家位于伦敦的初创公司,正在建立一个市场,为众多建设 LLM 项目的公司和愿意向他们授权数据的公司之间促成此类交易。
其目标是帮助 AI 公司找到训练模型的数据,同时确保版权持有者选择加入并获得补偿。版权持有者免费上传内容,并与 AI 公司联系以达成收入分成或订阅交易。Human Native AI 还帮助版权持有者准备和定价其内容,并监控任何版权侵权行为。Human Native AI 从每笔交易中抽取一定比例,并向 AI 公司收取交易和监控服务费用。 首席执行官兼联合创始人詹姆斯·史密斯 (James Smith) 告诉 TechCrunch,他从过去在谷歌 DeepMind 项目上工作的经历中获得了 Human Native AI 的想法。DeepMind 也遇到了没有足够好的数据来正确训练系统的问题。然后他看到其他人工智能公司也遇到了同样的问题。
“感觉我们正处于生成式人工智能的 Napster 时代,”史密斯说。“我们能进入一个更好的时代吗?我们能更容易地获取内容吗?我们能给创作者一定程度的控制权和补偿吗?我一直在想,为什么没有市场呢?” 史密斯和朋友杰克·加利利(GRAIL 的工程师)在公园散步时向他们提出了这个想法,就像史密斯提出过许多其他潜在的创业想法一样。但与过去不同的是,加利利说他们应该试一试。 该公司于 4 月成立,目前处于测试阶段。史密斯表示,双方的需求都非常令人鼓舞,他们已经签署了一些合作伙伴关系,将在不久的将来公布。Human Native AI 本周宣布了由两家英国微型风险投资公司 LocalGlobe 和 Mercuri 领投的 280 万英镑种子轮融资。史密斯表示,该公司计划利用这笔资金扩充团队。
“我是一家成立仅两个月的公司的首席执行官,却能与拥有 160 年历史的出版公司的首席执行官会面,”史密斯说。“这说明出版方面的需求很高。同样,与大型 AI 公司的每一次对话都是如此。”
虽然还处于早期阶段,但 Human Native AI 正在构建的东西似乎是不断发展的 AI 行业中缺少的一块基础设施。大型 AI 公司需要大量数据进行训练,为版权持有者提供更简单的合作方式,同时让他们完全控制其内容的使用方式,这似乎是一种让双方都满意的好方法。 “索尼音乐刚刚向 700 家人工智能公司发出信函,要求他们停止这种行为,”史密斯说。“这就是市场规模和可能获取数据的潜在客户。考虑到出版商和版权持有者的数量,这个数字可能达到数千甚至数万。我们认为这就是我们需要基础设施的原因。” 我还认为,这可能对较小的人工智能系统更有利,因为它们不一定有资源与 Vox 或 The Atlantic 签订协议,仍能获取数据进行训练。史密斯说,他们也希望如此,到目前为止,所有值得注意的许可协议都涉及较大的人工智能参与者。他希望 Human Native AI 能够帮助创造公平的竞争环境。
“授权内容面临的一个主要挑战是前期成本高昂,而且合作对象受到严格限制,”史密斯说。“我们如何增加内容购买者的数量并降低准入门槛?我们认为这真的很令人兴奋。” 另一个有趣的方面是 Human Native AI 收集的数据的未来潜力。史密斯表示,未来他们将能够根据平台上的交易数据历史,让版权持有者更清楚地了解如何为其内容定价。
现在也是人类原生人工智能推出的好时机。史密斯表示,随着欧盟人工智能法案的不断发展,以及美国未来可能出台的人工智能监管,人工智能公司合乎道德地获取数据——并有收据来证明这一点——将变得更加紧迫。 “我们对人工智能的未来及其未来发展持乐观态度,但我们必须确保作为一个行业,我们有责任心,不要摧毁那些让我们走到这一步的行业,”史密斯说。“这对人类社会不利。我们需要确保找到正确的方法让人们参与其中。我们是站在人类一边的人工智能乐观主义者。”
|