研究揭示：大语言模型会背诵并复现受版权保护的书籍

📅 2026-03-28 05:11 Nav Toor 人工智能 1 分鐘 583 字評分: 82

📌 一句话摘要一项来自石溪大学和哥伦比亚大学法学院的新研究表明，GPT-4o、Gemini 和 DeepSeek 等主流大语言模型能够逐字复现受版权保护的书籍，这直接挑战了 AI 行业的既有主张。 📝 详细摘要研究人员证实，包括 GPT-4o、Gemini 2.5 Pro 和 DeepSeek V3.1 在内的领先大语言模型（LLM）中，确实包含受版权保护书籍的逐字记忆内容。通过针对特定作者的作品对模型进行微调，研究人员成功提取了受版权保护作品的全文复本，这反驳了 AI 公司在法律诉讼中的辩词——即模型仅学习模式而不存储完整内容。该研究揭示了当前安全和对齐机制的重大失效，表明受版权保护

📌 一句话摘要

一项来自石溪大学和哥伦比亚大学法学院的新研究表明，GPT-4o、Gemini 和 DeepSeek 等主流大语言模型能够逐字复现受版权保护的书籍，这直接挑战了 AI 行业的既有主张。

📝 详细摘要

研究人员证实，包括 GPT-4o、Gemini 2.5 Pro 和 DeepSeek V3.1 在内的领先大语言模型（LLM）中，确实包含受版权保护书籍的逐字记忆内容。通过针对特定作者的作品对模型进行微调，研究人员成功提取了受版权保护作品的全文复本，这反驳了 AI 公司在法律诉讼中的辩词——即模型仅学习模式而不存储完整内容。该研究揭示了当前安全和对齐机制的重大失效，表明受版权保护的数据已深深植入模型权重之中。

📊 文章信息

AI 评分：82

来源：Nav Toor(@heynavtoor)

作者：Nav Toor

分类：人工智能

语言：英文

阅读时间：9 分钟

字数：2160

标签： AI 版权, LLM 记忆, GPT-4o, Gemini, DeepSeek

阅读推文

查看原文 → 發佈: 2026-03-28 05:11:03 收錄: 2026-03-28 10:00:40

研究揭示：大语言模型会背诵并复现受版权保护的书籍

🤖 問 AI