首页 > 快讯 > Meta 涉嫌使用未出版书籍训练 AI 模型引发关注

Meta 涉嫌使用未出版书籍训练 AI 模型引发关注

发布时间：2025-03-31 14:03:06 | 责任编辑：字母汇 | 浏览量：248 次

《Meta 涉嫌使用未出版书籍训练 AI 模型引发关注》相关软件官网

上周，《大西洋月刊》推出了一款新工具，旨在搜索一个名为 LibGen 的数据库，该数据库据称是 Meta 公司训练其人工智能（AI）模型的来源。此消息引起了广泛关注，因为其中涉及了很多尚未出版的作品。作家 Maris Kreizman 在为《文学中心》撰写的文章中透露，她发现自己的即将出版的论文集竟然也出现在这个数据库中。
Kreizman 表示，她的论文集将在7月1日正式出版，而 Meta 公司却已经在此之前访问了她的作品用于训练 AI 模型。这让她感到震惊，因为这种情况在出版行业中是极为少见的。一般来说，未出版作品的数字版在像 NetGalley 和 Edelweiss 这样的合法平台上提供，且这些平台都有严格的条款和条件，限制用户对未出版作品的使用。
这并不是个别现象，随着人工智能技术的发展，越来越多的创作者开始担心自己的作品在未经授权的情况下被使用。Kreizman 的发现也引发了更广泛的讨论，关于创作者的权益、知识产权以及如何在 AI 快速发展的背景下保护这些权益。
在许多作者看来，未经同意使用他们的未出版作品，不仅是对创作劳动的不尊重，也可能对他们的职业生涯造成负面影响。此事件也引发了对 Meta 公司训练 AI 所用数据来源的质疑，尤其是在其是否遵循法律和道德规范方面。
划重点:
📚 Meta 公司被指控在未经作者同意的情况下，使用未出版书籍训练其 AI 模型。
🤔 作家 Maris Kreizman 发现自己的论文集在 Meta 的数据库中，令人震惊。
⚖️ 事件引发了对创作者权益及 AI 训练数据合法性的广泛讨论。

Meta（原Facebook）近期因涉嫌使用未授权书籍（包括盗版内容）训练其AI模型而陷入法律与伦理争议，引发全球出版界和监管机构的关注。以下是事件的关键点：

1. 核心指控：Meta 被曝使用盗版书籍训练AI模型

数据来源争议：Meta 被指控从“影子图书馆”（如LibGen、Z-Library）下载大量盗版书籍用于训练其开源大模型 LLaMA，其中部分内容涉及未授权作品。
二次传播问题：研究显示，Meta 不仅下载盗版书籍，还通过 BitTorrent 重新上传约 30% 的内容，客观上延长了盗版作品的传播链。
内部文件曝光：法庭文件显示，Meta 高管讨论过使用LibGen数据的风险，甚至有员工承认删除版权信息以规避法律问题。

2. 法律诉讼与行业反应

作家与出版商集体诉讼：包括普利策奖得主迈克尔·夏邦、喜剧演员莎拉·西尔弗曼在内的创作者起诉Meta侵犯版权。
法国出版商协会起诉：指控Meta“大规模掠夺”版权内容，要求赔偿。
欧盟介入调查：可能依据《欧盟AI法案》对Meta采取行动，若败诉，Meta或需为训练数据支付授权费。

3. Meta的回应与行业影响

Meta的辩护：公司辩称AI训练属于“合理使用”（fair use），并否认故意传播盗版。
行业影响：此案可能重塑AI行业的数据获取规则，迫使企业更谨慎选择训练数据来源。
数据竞争加剧：OpenAI、Anthropic等公司已开始付费获取授权数据，Meta的做法可能面临更严格审查。

4. 未来展望

法律判决关键性：若法院认定Meta需为训练数据付费，将大幅增加AI研发成本，影响行业格局。
伦理与合规挑战：科技公司需在创新与版权保护间找到平衡，可能推动更多合规数据解决方案（如授权数据集、合成数据）。

Meta 的案例凸显了AI发展中的版权困境，未来监管与行业自律将成为关键议题。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇：京东注册JoyAI商标

下一篇：联想CTO：押注多模态AI协作，打造模型工厂加速智能体落地

Meta 涉嫌使用未出版书籍训练 AI 模型引发关注

1. 核心指控：Meta 被曝使用盗版书籍训练AI模型

2. 法律诉讼与行业反应

3. Meta的回应与行业影响

4. 未来展望

最新Ai信息

最新Ai工具

热门AI推荐