普林斯顿大学助理教授刘壮在最新访谈中提出核心观点:架构选择不如数据重要,数据集远未达到真正的多样性,记忆而非能力是当前 AI 的最大瓶颈。
📝 详细摘要
本文是量子位对普林斯顿大学助理教授刘壮在《信息瓶颈》播客中访谈的深度编译。刘壮以 ConvNeXt、ImageBind 等 10 万+引用论文作者的身份,对 AI 领域多个核心假设提出质疑。他提出五个核心判断:架构选择不如数据重要,只要残差连接、自注意力等基础组件做对,ConvNet 和 Transformer 最终会收敛到同一条性能曲线;数据集远未达到真正的多样性,他与何恺明的实验表明,三个号称多样化的亿级数据集在模型眼中仍然泾渭分明;大语言模型在语言空间内拥有世界模型,但在视觉空间因数据密度过高而尚未实现;记忆而非推理能力是当前最大瓶颈,需要多个智能体协作恰恰是因为单个智能体记不住所有事;自主科研尚未到位,AI 在提出有意义问题、设计实验等方面仍无法替代研究生。访谈贯穿一条主线:AI 领域中被奉为圭臬的许多东西其实是历史偶然,真正决定成败的是数据、规模和记忆这些朴素因素。
💡 主要观点
- 架构选择不如数据重要,ConvNet 和 Transformer 最终收敛到同一条性能曲线。 刘壮通过 ConvNeXt 研究证明,只要残差连接、自注意力、归一化层、线性层等基础组件做对,不同架构在充分优化后会达到相近的性能前沿,真正推动进步的是数据规模和计算规模。
💬 文章金句
- 只要把残差连接、自注意力、归一化层、线性层这四大基础做对,不管用 ConvNet 还是 Transformer,最终都会落在同一条性能曲线上。
- 过去十年真正推动 AI 进步的,是更大程度上是数据规模和计算规模,而不只是架构创新。
- 大语言模型在语言空间里是有世界模型的,这毫无疑问。
- 记忆才是当前最大的瓶颈,不是能力。
- 我们需要那么多智能体协作,恰恰是因为一个智能体记不住所有事情。
📊 文章信息
AI 初评:88
来源:量子位
作者:听雨
分类:人工智能
语言:中文
阅读时间:56 分钟
字数:13983
标签: 刘壮, AI架构, 数据质量, 世界模型, AI记忆