首页 > 快讯 > Meta 涉嫌使用未出版书籍训练 AI 模型引发关注

Meta 涉嫌使用未出版书籍训练 AI 模型引发关注

发布时间:2025-03-31 14:03:06 | 责任编辑:字母汇 | 浏览量:18 次

《Meta 涉嫌使用未出版书籍训练 AI 模型引发关注》相关软件

Meta AI

上周,《大西洋月刊》推出了一款新工具,旨在搜索一个名为 LibGen 的数据库,该数据库据称是 Meta 公司训练其人工智能(AI)模型的来源。此消息引起了广泛关注,因为其中涉及了很多尚未出版的作品。作家 Maris Kreizman 在为《文学中心》撰写的文章中透露,她发现自己的即将出版的论文集竟然也出现在这个数据库中。
Kreizman 表示,她的论文集将在7月1日正式出版,而 Meta 公司却已经在此之前访问了她的作品用于训练 AI 模型。这让她感到震惊,因为这种情况在出版行业中是极为少见的。一般来说,未出版作品的数字版在像 NetGalley 和 Edelweiss 这样的合法平台上提供,且这些平台都有严格的条款和条件,限制用户对未出版作品的使用。
这并不是个别现象,随着人工智能技术的发展,越来越多的创作者开始担心自己的作品在未经授权的情况下被使用。Kreizman 的发现也引发了更广泛的讨论,关于创作者的权益、知识产权以及如何在 AI 快速发展的背景下保护这些权益。
在许多作者看来,未经同意使用他们的未出版作品,不仅是对创作劳动的不尊重,也可能对他们的职业生涯造成负面影响。此事件也引发了对 Meta 公司训练 AI 所用数据来源的质疑,尤其是在其是否遵循法律和道德规范方面。
划重点:
📚 Meta 公司被指控在未经作者同意的情况下,使用未出版书籍训练其 AI 模型。
🤔 作家 Maris Kreizman 发现自己的论文集在 Meta 的数据库中,令人震惊。
⚖️ 事件引发了对创作者权益及 AI 训练数据合法性的广泛讨论。

Meta 涉嫌使用未出版书籍训练 AI 模型引发关注

Meta(原Facebook)近期因涉嫌使用未授权书籍(包括盗版内容)训练其AI模型而陷入法律与伦理争议,引发全球出版界和监管机构的关注。以下是事件的关键点:

1. 核心指控:Meta 被曝使用盗版书籍训练AI模型

  • 数据来源争议:Meta 被指控从“影子图书馆”(如LibGen、Z-Library)下载大量盗版书籍用于训练其开源大模型 LLaMA,其中部分内容涉及未授权作品。
  • 二次传播问题:研究显示,Meta 不仅下载盗版书籍,还通过 BitTorrent 重新上传约 30% 的内容,客观上延长了盗版作品的传播链。
  • 内部文件曝光:法庭文件显示,Meta 高管讨论过使用LibGen数据的风险,甚至有员工承认删除版权信息以规避法律问题。

2. 法律诉讼与行业反应

  • 作家与出版商集体诉讼:包括普利策奖得主迈克尔·夏邦、喜剧演员莎拉·西尔弗曼在内的创作者起诉Meta侵犯版权。
  • 法国出版商协会起诉:指控Meta“大规模掠夺”版权内容,要求赔偿。
  • 欧盟介入调查:可能依据《欧盟AI法案》对Meta采取行动,若败诉,Meta或需为训练数据支付授权费。

3. Meta的回应与行业影响

  • Meta的辩护:公司辩称AI训练属于“合理使用”(fair use),并否认故意传播盗版。
  • 行业影响:此案可能重塑AI行业的数据获取规则,迫使企业更谨慎选择训练数据来源。
  • 数据竞争加剧:OpenAI、Anthropic等公司已开始付费获取授权数据,Meta的做法可能面临更严格审查。

4. 未来展望

  • 法律判决关键性:若法院认定Meta需为训练数据付费,将大幅增加AI研发成本,影响行业格局。
  • 伦理与合规挑战:科技公司需在创新与版权保护间找到平衡,可能推动更多合规数据解决方案(如授权数据集、合成数据)。

Meta 的案例凸显了AI发展中的版权困境,未来监管与行业自律将成为关键议题。

最新Ai信息

最新Ai工具