← 回總覽

研究揭示:大语言模型会背诵并复现受版权保护的书籍

📅 2026-03-28 05:11 Nav Toor 人工智能 1 分鐘 583 字 評分: 82
AI 版权 LLM 记忆 GPT-4o Gemini DeepSeek
📌 一句话摘要 一项来自石溪大学和哥伦比亚大学法学院的新研究表明,GPT-4o、Gemini 和 DeepSeek 等主流大语言模型能够逐字复现受版权保护的书籍,这直接挑战了 AI 行业的既有主张。 📝 详细摘要 研究人员证实,包括 GPT-4o、Gemini 2.5 Pro 和 DeepSeek V3.1 在内的领先大语言模型(LLM)中,确实包含受版权保护书籍的逐字记忆内容。通过针对特定作者的作品对模型进行微调,研究人员成功提取了受版权保护作品的全文复本,这反驳了 AI 公司在法律诉讼中的辩词——即模型仅学习模式而不存储完整内容。该研究揭示了当前安全和对齐机制的重大失效,表明受版权保护

📌 一句话摘要

一项来自石溪大学和哥伦比亚大学法学院的新研究表明,GPT-4o、Gemini 和 DeepSeek 等主流大语言模型能够逐字复现受版权保护的书籍,这直接挑战了 AI 行业的既有主张。

📝 详细摘要

研究人员证实,包括 GPT-4o、Gemini 2.5 Pro 和 DeepSeek V3.1 在内的领先大语言模型(LLM)中,确实包含受版权保护书籍的逐字记忆内容。通过针对特定作者的作品对模型进行微调,研究人员成功提取了受版权保护作品的全文复本,这反驳了 AI 公司在法律诉讼中的辩词——即模型仅学习模式而不存储完整内容。该研究揭示了当前安全和对齐机制的重大失效,表明受版权保护的数据已深深植入模型权重之中。

📊 文章信息

AI 评分:82

来源:Nav Toor(@heynavtoor)

作者:Nav Toor

分类:人工智能

语言:英文

阅读时间:9 分钟

字数:2160

标签: AI 版权, LLM 记忆, GPT-4o, Gemini, DeepSeek

阅读推文

查看原文 → 發佈: 2026-03-28 05:11:03 收錄: 2026-03-28 10:00:40

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。