AI 教父 Yann LeCun 公开 diss：谁再说像素重建没问题，我跟谁急！带 10 亿美元离开 Meta 只为证明你们走错了！

📌 一句话摘要

本文梳理了图灵奖得主 Yann LeCun 对当前主流生成式 AI 路线的尖锐批评，阐述了他为何认为「像素重建」和「下一 Token 预测」是错误方向，并介绍了他押注的 JEPA 架构和世界模型理念。

📝 详细摘要

文章以 Yann LeCun 的公开言论为线索，系统阐述了他对当前 AI 主流范式的根本性质疑。LeCun 认为，以 LLM 为代表的「下一 Token 预测」和以扩散模型为代表的「逐像素重建」在物理世界面前走不通，因为真实世界是连续、无限且充满不确定性的，而语言是离散、有边界的。他提出，真正的智能体必须具备预测自身行为后果的能力，而这需要构建「世界模型」。文章详细介绍了 LeCun 提出的替代方案——JEPA（联合嵌入预测架构），该架构不输出像素或 Token，而是在抽象的表示空间中进行预测，通过孪生网络和 Barlow Twins 等技术避免表示崩溃。文章还提及 LeCun 离开 Meta 创立 AMI Labs 并获得 10 亿美元投资，以实践其理念。

💡 主要观点

- LeCun 认为「下一 Token 预测」和「逐像素重建」是错误方向。 他指出，语言是离散的、有边界的，因此 Token 预测可行；但物理世界是连续的、无限的，逐像素预测会导致模糊和不确定性，无法真正理解世界。

真正的智能体必须能预测自身行为的后果。 LeCun 认为，当前 LLM 只是复述人类语言的统计规律，缺乏对物理世界的因果理解，因此不能被称为真正的智能体。

JEPA 架构是 LeCun 押注的替代路径。 JEPA 不生成像素或 Token，而是在抽象的表示空间中进行预测，通过编码器将输入压缩为向量，再在向量空间预测未来表示，从而避免处理不可预测的冗余细节。

LeCun 通过 Barlow Twins 等技术解决了表示崩溃问题。 表示崩溃是联合嵌入方法的核心挑战，LeCun 团队提出的 Barlow Twins 和 VicReg 通过减少冗余信息来防止模型退化，DINO 系列模型在 ImageNet 上取得了与监督学习相当的成绩。

💬 文章金句

- 一个没有预测自身行为后果能力的系统，不配成为真正的智能体。

像素重建是个坏主意，并不是自监督学习的正确方向。
联合嵌入比传统方法更适合表示学习。
我实在无法理解，一个没有预测自身行为后果能力的系统，凭什么被称为真正的智能体？

📊 文章信息

AI 初评：85

来源：51CTO技术栈

作者：51CTO技术栈

分类：人工智能

语言：中文

阅读时间：15 分钟

字数：3523

标签： Yann LeCun, JEPA, 世界模型, 自监督学习, 生成式 AI

阅读完整文章

AI 教父 Yann LeCun 公开 diss：谁再说像素重建没问题，我跟谁急！带 10 亿美元离开 Meta 只为证明你们走错了！

🤖 問 AI