我买了这些畅销书，但作者不是人

📌 一句话摘要

本文深入剖析了 AI 生成内容对出版业的冲击，揭示了从亚马逊电子书泛滥、投机者批量制造垃圾书籍，到 Meta 等巨头未经授权抓取数据训练模型，最终导致“模型崩溃”的恶性循环，并反思了阅读的本质与价值。

📝 详细摘要

文章以知名医学家 Topol 教授被冒名出版书籍的真实事件为引，系统揭露了 AI 对出版业的深刻影响。核心内容包括：1）自 ChatGPT 问世后，亚马逊电子书月发行量翻两倍，至 2025 年底每月新书达 30 万本，其中大量为 AI 生成的流水线产品；2）投机者利用 Youbooks 等 AI 工具批量制造电子书牟利，如 27 岁年轻人声称靠 1500 本 AI 电子书赚取 300 万美元；3）AI 垃圾书籍围剿真实创作者，导致劣币驱逐良币，原生创作者被迫出逃；4）Meta 等科技巨头为训练大模型，未经授权抓取盗版数字图书馆 LibGen 的 750 万本书和 8100 万篇论文；5）AI 垃圾的泛滥导致“模型崩溃”风险——当下一代爬虫抓取的数据本身是 AI 生成的废料时，模型将不可避免地退化。文章最后引用博尔赫斯的“巴别图书馆”和 C.S.路易斯的名言，呼吁读者珍视那些带有真实生命体验的文字。

💡 主要观点

- AI 生成内容导致电子书市场泛滥，劣币驱逐良币。 自 ChatGPT 问世，亚马逊电子书月发行量翻两倍，至 2025 年底每月新书达 30 万本，大量为 AI 流水线产品，稀释了真实作品的曝光率和收益。

科技巨头未经授权抓取数据训练大模型，构成根本性原罪。 Meta 为训练 Llama 3，内部讨论后决定通过 BT 种子下载盗版数字图书馆 LibGen，包含 750 万本书和 8100 万篇论文，暴露了 AI 产业对原创内容的系统性掠夺。

AI 垃圾的泛滥将导致“模型崩溃”的衔尾蛇困局。 当互联网被 AI 生成内容填满，下一代大模型爬虫抓取的数据将主要是 AI 废料，导致模型质量不可逆地退化，形成“垃圾进，垃圾出”的恶性循环。

阅读的本质在于与真实生命体验的连接，这是 AI 无法替代的。 引用 C.S.路易斯“我们阅读，是为了知道自己并不孤单”，强调文字的价值在于作者真实的生命体验，AI 虽能生成精巧故事，却无法体会情感重量。

💬 文章金句

- 你花钱买了一本书，却发现作者压根不存在。

Garbage in， garbage out（垃圾进，垃圾出）。
宛如一条正在吞食自己尾巴的「衔尾蛇（Ouroboros）」，AI 曾经吞下的是人类文明的经典，现在，它却不得不吃下自己和同类排泄出的数字废料。
我们阅读，是为了知道自己并不孤单。
AI 能在几秒钟内生成一百万个结构精巧的故事，却也体会不到哪怕一滴眼泪的重量。

📊 文章信息

AI 初评：86

来源：爱范儿

作者：莫崇宇

分类：商业科技

语言：中文

阅读时间：13 分钟

字数：3049

标签： AI生成内容, 出版业, 亚马逊, 模型崩溃, 数据版权

阅读完整文章

我买了这些畅销书，但作者不是人

🤖 問 AI