一家学术出版商在作者不知情的情况下与微软达成了一项人工智能数据协议

Josiah01 发表于 2024-7-24 10:06:32

　　今年 5 月，总部位于英国、市值数十亿美元的跨国公司 Informa 在一份交易更新中宣布，它已与微软签署了一项协议，涉及“获取高级学习内容和数据，以及合作探索人工智能专家应用程序”。Informa 是Taylor & Francis的母公司，该公司出版各种学术和技术书籍和期刊，因此所涉及的数据可能包括这些书籍和期刊的内容。
　　根据上周发布的报道，内容作者似乎并未被询问或告知有关该交易。此外，他们表示，他们没有机会选择退出该交易，也不会从中获得任何收益。
　　学术界只是我们所谓的内容创造者中最新的一群，他们对自己的作品被生成式人工智能模型吞噬感到愤怒，而这些模型目前正在竞相吸收人类文化产品。报纸、视觉艺术家和唱片公司已经将人工智能公司告上法庭。
　　虽然目前还不清楚 Informa 将如何应对这些不满情绪，但这笔交易提醒作家们要注意他们签署的出版协议的合同条款。
　　Informa 交易的内容是什么？
　　Informa 的最新消息指出了微软交易的四个重点领域：
　　提高 Informa 自身的生产力
　　开发自动引用工具
　　开发人工智能研究助理软件（可能像在线学术图书馆 JSTOR正在测试的系统）
　　授予微软数据访问权限以“帮助提高人工智能系统的相关性和性能”。
　　Informa 将获得超过 800 万英镑（1550 万澳元）的初始数据使用费，随后三年将定期支付未指定金额的费用。
　　我们不知道微软计划如何利用其数据访问权，但可能的情况是，学术书籍和文章的内容将被添加到类似 ChatGPT 的生成式 AI 模型的训练数据中。原则上，这应该会使 AI 系统的输出更加准确，尽管现有的 AI 模型受到了严厉批评，不仅是因为在没有引用的情况下重新引用训练数据（这可以看作是一种抄袭），还因为捏造虚假信息并将其归因于真实来源。
　　然而，更新版本还表示“该协议保护知识产权，包括对逐字文本摘录的限制以及对详细引用参考的重要性的一致性。”
　　所提到的“对逐字文本摘录的限制”可能涉及美国的合理使用原则，该原则允许对受版权保护的材料进行某些使用。
　　目前，许多生成式人工智能公司因使用训练数据而面临版权侵权诉讼，而他们的辩护很可能依赖于主张合理使用。
　　“详细引用参考的重要性”可能与版权中的署名概念有关。这是作者拥有的一项道德权利。它规定，在复制作品时，应知晓作品的创作者，并将其归为作者。
　　学术出版通常是如何进行的？
　　大多数学者不会从其大部分学术出版物中获得报酬或任何利润。相反，撰写期刊和会议论文通常被视为全职终身职位工作范围的一部分。出版物可以建立学者的信誉并促进他们的研究。
　　基本流程通常是这样的：作者研究并撰写原创文章，然后将其提交给期刊出版商进行同行评审。大多数同行评审员和编辑委员会成员也不会因其工作而获得报酬。
　　事实上，一些期刊可能会要求作者支付“文章处理费”来支付编辑和其他费用。对于开放获取出版物来说，这可能高达数千美元。一般来说，出版物越有名望，费用就越高。
　　如果文章通过了同行评审，作者将被要求签署出版协议。条款可能涵盖后勤安排，例如文章的出版时间、格式（印刷、在线或两者兼有）以及版税分配（如果适用）。还将涉及文章的版权和所有权的安排。
　　作者通常还必须授予出版商分发和出版文章的独家权利。这可能意味着作者不能在其他地方发表文章，出版商也可能能够将文章转授权给第三方，例如人工智能公司。
　　有时出版商会要求作者通过永久版权转让协议将文章的版权转让给他们。
　　本质上，这意味着作者将其作为作品版权持有者的所有著作权授予出版商。然后，出版商可以根据自己的意愿复制、传播、分发或授权他人使用该作品。
　　有可能只分配有限的权利，而不是所有的权利，这是作者应该考虑的。
　　内容挖掘
　　至关重要的是，作者必须了解许可和转让的含义，并在签订合同时仔细考虑他们同意的内容。鉴于最近出版商与生成 AI 公司签订协议的趋势，出版商的 AI 政策也应受到严格审查。
　　美国最近发布了针对内部人工智能系统内容使用的标准集体许可解决方案，其中规定了版权持有人的权利和报酬。类似的人工智能系统内容使用许可可能很快就会进入澳大利亚市场。
　　学术出版商和人工智能公司之间达成的协议类型引发了许多学者的更大担忧。我们是否希望将学术研究简化为人工智能知识挖掘的内容？对于此类做法的伦理和道德问题，目前尚无明确的答案。

页: [1]

NewCET's Archiver

一家学术出版商在作者不知情的情况下与微软达成了一项人工智能数据协议