首页 > 快讯 > NVIDIA 遭遇版权争议:涉嫌与“影子图书馆”合作以获得数百万本盗版书籍用于AI训练

NVIDIA 遭遇版权争议:涉嫌与“影子图书馆”合作以获得数百万本盗版书籍用于AI训练

发布时间:2026-01-20 18:47:38 | 责任编辑:吴昊 | 浏览量:2 次

全球芯片巨头英伟达(NVIDIA)近期因 AI 模型训练数据来源问题深陷法律纠纷。一份最新提交给美国加州法院的修正起诉书披露了惊人细节:英伟达被指控为了在竞争中保持领先,主动与全球知名的盗版电子书站点Anna’s Archive进行接触,试图获取数百万本受版权保护的书籍。
原告方由 Abdi Nazemian 等多位作家组成,他们声称英伟达在面临2023年开发者大会的交付压力下,内部战略团队成员曾直接询问Anna’s Archive能提供哪些资源,并表达了将其纳入大语言模型(LLM)预训练数据的意愿。指控指出,尽管对方曾明确提醒其馆藏属于非法获取,英伟达管理层仍在一周内“开绿灯”批准继续推进,从而获得了约500TB 的海量数据访问权。
除了Anna’s Archive,起诉书还提到英伟达可能使用了 LibGen、Sci-Hub 及 Z-Library 等其他“影子图书馆”的数据来源。此外,该公司还被指向企业客户分发工具,协助其自动获取包含盗版作品的数据集,因此被指控存在“替代侵权”和“共同侵权”行为。英伟达此前曾试图以“合理使用”为由进行辩解,但随着这些内部邮件等关键证据的流出,案件正向着更有利于版权方的方向发展。
划重点:
⚖️ 深陷集体诉讼:多位知名作家联合指控英伟达大规模使用盗版图书训练其 NeMo、Megatron 等核心模型。
📑 主动接洽盗版源:内部邮件显示英伟达曾主动联络Anna’s Archive,甚至询问如何通过支付费用获得500TB 数据的高速下载权限。
🛡️ 侵权指控升级:原告不仅指控其内部训练违规,还控诉英伟达向客户提供自动化脚本,间接助长了盗版数据的二次传播。

NVIDIA 遭遇版权争议:涉嫌与“影子图书馆”合作以获得数百万本盗版书籍用于AI训练

这是一篇关于英伟达身陷版权风暴:被指主动接触“影子图书馆”获取数百万盗版书训练 AI的文章,内容值得关注。

©️版权声明:
本网站(https://aigc.izzi.cn)刊载的所有内容,包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。除此以外,将本网站任何内容或服务用于其他用途时,须征得本网站及相关权利人的书面许可,并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

最新Ai信息

最新Ai工具

热门AI推荐