← 回總覽

爱思唯尔把 Meta 告了:拿 Sci-Hub 盗版论文训练大模型

📅 2026-05-13 11:10 西风 商业科技 2 分鐘 1319 字 評分: 82
爱思唯尔 Meta 版权诉讼 AI训练 合理使用
📌 一句话摘要 爱思唯尔联合多家出版集团起诉 Meta,指控其使用 Sci-Hub 和 Common Crawl 中的盗版学术论文训练 Llama 模型,这是主流学术出版商首次对 AI 公司发起版权诉讼。 📝 详细摘要 文章报道了学术出版巨头爱思唯尔(Elsevier)联合阿歇特、麦克米伦等出版集团及作家 Scott Turow,在纽约南区法院对 Meta 及其 CEO 扎克伯格提起版权诉讼。原告指控 Meta 为训练 Llama 大语言模型,未经授权从 Common Crawl 数据集以及盗版学术平台 LibGen 和 Sci-Hub 大量获取并复制受版权保护的科研论文。文章指出,这是主

📌 一句话摘要

爱思唯尔联合多家出版集团起诉 Meta,指控其使用 Sci-Hub 和 Common Crawl 中的盗版学术论文训练 Llama 模型,这是主流学术出版商首次对 AI 公司发起版权诉讼。

📝 详细摘要

文章报道了学术出版巨头爱思唯尔(Elsevier)联合阿歇特、麦克米伦等出版集团及作家 Scott Turow,在纽约南区法院对 Meta 及其 CEO 扎克伯格提起版权诉讼。原告指控 Meta 为训练 Llama 大语言模型,未经授权从 Common Crawl 数据集以及盗版学术平台 LibGen 和 Sci-Hub 大量获取并复制受版权保护的科研论文。文章指出,这是主流出版集团首次针对 AI 企业的版权诉讼,此前多为作家或媒体机构起诉。Meta 方面表示将积极应诉,并援引「合理使用」(Fair Use)原则进行抗辩,认为使用版权内容训练 AI 属于转化性使用。文章还提及了此前 Anthropic 在类似诉讼中胜诉的案例,指出 AI 训练版权问题目前仍缺乏明确司法判例。

💡 主要观点

- 爱思唯尔等出版集团首次对 AI 公司发起版权诉讼。 原告指控 Meta 未经授权使用盗版学术论文训练 Llama 模型,这是主流学术出版商首次下场维权,标志着 AI 版权战火蔓延至学术出版领域。

Meta 的数据来源被指包括 Common Crawl 和盗版平台 LibGen、Sci-Hub。 诉状指出 Meta 训练 Llama 的数据集可能混入了受版权保护的付费期刊内容,并明确指控其通过磁力下载等方式从盗版学术库获取资源。
Meta 将以「合理使用」原则进行抗辩。 Meta 援引美国版权法中的「合理使用」原则,认为使用版权内容训练 AI 属于转化性使用,不构成侵权,此前 Anthropic 在类似案件中曾以此胜诉。

💬 文章金句

- 这是主流出版集团首次发起针对 AI 企业的诉讼,Meta 明目张胆侵犯版权,出版商们将还原全部事实。

  • AI 正为个人与企业带来颠覆性创新、提升生产效率与创作活力,已有法院判例认定,使用版权内容训练 AI 可构成合理使用。
  • 利用版权作品训练大语言模型是否合法,目前仍未形成明确司法判例。

📊 文章信息

AI 初评:82

来源:量子位

作者:西风

分类:商业科技

语言:中文

阅读时间:6 分钟

字数:1356

标签: 爱思唯尔, Meta, 版权诉讼, AI训练, 合理使用

阅读完整文章

查看原文 → 發佈: 2026-05-13 11:10:53 收錄: 2026-05-13 14:00:03

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。