首页 > 快讯 > Llama AI 吞食42%哈利波特内容,Meta 或将因AI侵权面临高额诉讼

Llama AI 吞食42%哈利波特内容,Meta 或将因AI侵权面临高额诉讼

发布时间:2025-06-18 09:51:21 | 责任编辑:张毅 | 浏览量:6 次

近期一项由斯坦福大学、康乃尔大学及西维吉尼亚大学研究人员发表的论文显示,Meta 的 Llama3.1AI 模型能够逐字重现大量受版权保护的书籍内容,这为这家科技巨头带来了潜在的巨额法律风险。研究指出,Llama3.170B 模型在测试中能够重现《哈利波特:神秘的魔法石》高达42% 的文本内容,远超第一代 Llama 模型的4.4%。
人工智能模型,如 OpenAI 的 ChatGPT 和 Meta 的 Llama,通常通过海量数据训练,旨在识别并生成新的模式。然而,该研究的关键发现是,Meta 的 Llama 模型似乎并非仅仅学习语言模式,而是能够近乎“完整地记住”某些书籍,例如《哈利波特》和《1984》。斯坦福技术法律专家马克·莱姆利表示,如果 AI 能够生成其训练数据的完整摘录,那么它就不再被视为基于学习的“变革性作品”,而更像是一个包含版权作品的“巨型 .ZIP 文件”,用户可以随意复制。
版权之争新焦点:逐字重现 VS. 学习模式
在测试 OpenAI、DeepSeek 和微软等公司的 AI 模型时,莱姆利的研究团队发现 Meta 的 Llama 是唯一一款能够准确复述书籍内容的模型。除了《哈利波特》系列的首部作品,该模型还展现出对 F·斯科特·菲茨杰拉德的《了不起的盖茨比》和乔治·奥威尔的《1984》的显著记忆能力。
Meta 使用受版权保护的材料训练 AI 备受争议。该公司目前正面临多起版权诉讼,其中包括知名作家(如喜剧演员莎拉·西尔弗曼)提起的诉讼,指控 Meta 的模型基于非法获取的“Books3”数据集进行训练,该数据集包含近20万份受版权保护的出版物。据法庭文件显示,一名 Meta 工程师在下载种子文件时曾表示“用(Meta 旗下的)公司笔记本电脑下载种子,感觉不对劲”。
律师莱姆利估计,如果“Books3”数据集中的“仅有”3% 的内容被认定为侵权,Meta 可能面临近10亿美元的法定赔偿,这还不包括利润分成。如果侵权比例更高,Meta 潜在的法律责任将更为严峻。
法律专家立场转变,Meta 拒绝回应
值得注意的是,莱姆利本人曾代表 Meta 在之前的生成式 AI 版权诉讼(Kadrey v Meta Platforms)中进行辩护。然而,随着他领导了这项关于 AI 模型记忆和重现受版权内容的研究,他于今年早些时候宣布不再代理 Meta,以抗议该公司及其首席执行官马克·扎克伯格的某些行为。尽管他先前认为 Meta 应该胜诉,但新研究结果似乎已改变了他的看法。
Meta 对莱姆利的最新研究发现拒绝置评。

Llama AI 吞食42%哈利波特内容,Meta 或将因AI侵权面临高额诉讼

根据最新的信息,Meta 的 Llama 3.1 AI 模型确实被发现能够逐字重现大量受版权保护的书籍内容,其中包括《哈利·波特:神秘的魔法石》42% 的文本内容。这一发现引发了巨大的法律争议,因为如果 AI 模型能够近乎完整地“记住”并复述受版权保护的作品,那么它可能不再被视为基于学习的“变革性作品”,而是类似于一个包含版权作品的“巨型 .ZIP 文件”,这可能构成侵权。

争议焦点

  • 合理使用原则:Meta 主张其 AI 模型的训练属于“合理使用”范畴,即通过对受版权保护内容的学习来生成具有原创性的新内容。然而,原告方认为,Meta 的行为实际上是在非法复制受版权保护的作品,并利用这些作品生成可能侵占市场的新内容。

  • 侵权认定:法庭文件显示,Meta 被指控使用盗版书来训练 AI 模型,且未获得许可或支付报酬。此外,Meta 的工程师还被指删除电子书中的版权信息,以掩盖侵权行为。

法律风险

  • 巨额赔偿:如果 Meta 被认定侵权,可能面临巨额赔偿。据估计,如果“Books3”数据集中仅有3% 的内容被认定为侵权,Meta 可能面临近10亿美元的法定赔偿。

  • 法官质疑:在庭审中,美国地方法官 Vince Chhabria 对 Meta 的辩解提出质疑,认为其行为可能对原作品的市场造成损害,因此难以认定为“合理使用”。

后续影响

  • 行业警示:这一事件对整个 AI 行业是一个警示,强调了数据来源的合法性问题。未来,AI 公司在构建模型时可能需要更加谨慎地获取合法授权的数据。

  • 法律先例:该案件的裁决结果可能为未来类似的 AI 版权案件树立重要的先例。

目前,Meta 对相关研究发现拒绝置评,而案件仍在司法程序中推进。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

发表回复