一项来自石溪大学和哥伦比亚大学法学院的新研究表明,GPT-4o、Gemini 和 DeepSeek 等主流大语言模型能够逐字复现受版权保护的书籍,这直接挑战了 AI 行业的既有主张。
📝 详细摘要
研究人员证实,包括 GPT-4o、Gemini 2.5 Pro 和 DeepSeek V3.1 在内的领先大语言模型(LLM)中,确实包含受版权保护书籍的逐字记忆内容。通过针对特定作者的作品对模型进行微调,研究人员成功提取了受版权保护作品的全文复本,这反驳了 AI 公司在法律诉讼中的辩词——即模型仅学习模式而不存储完整内容。该研究揭示了当前安全和对齐机制的重大失效,表明受版权保护的数据已深深植入模型权重之中。
📊 文章信息
AI 评分:82
来源:Nav Toor(@heynavtoor)
作者:Nav Toor
分类:人工智能
语言:英文
阅读时间:9 分钟
字数:2160
标签: AI 版权, LLM 记忆, GPT-4o, Gemini, DeepSeek