E12.高阳：会思考的芦苇，会行动的机器｜北坡计划

📌 一句话摘要

对话千寻智能联创高阳，深度拆解具身智能的「GPT-3 时刻」、数据驱动的 Scaling Law 实践以及科学家创业的内在一致性。

📝 详细摘要

本期播客由绿洲资本张津剑对话千寻智能（SpiritAI）联合创始人、清华大学助理教授高阳。作为具身智能领域的顶尖学者，高阳分享了其从学术界转向产业界的认知升级：受 ChatGPT 启发，他坚信神经网络作为「通用函数拟合器」能将大模型的成功复制到物理交互领域。节目深入探讨了具身智能的技术路径，指出 2027 年将是具身智能的重大突破点。高阳详细对比了中美在数据收集（千万小时量级）、模型泛化性及 VLA（视觉-语言-动作）架构上的差异。此外，嘉宾还结合道家与佛教哲学，探讨了科学家创业者如何在高强度竞争中保持「心力不耗散」，强调「做自己」与内心稳定对于长期成功的决定性作用。

💡 主要观点

- 具身智能的 2027 年「GPT-3 时刻」预测 具身智能正从 GPT-2 水平向 GPT-3 跨越，核心指标在于泛化性。高阳预测 2027 年初将实现模型在任意场景下产生智能响应的突破，这依赖于从 1.5 万小时到千万小时级后训练数据的量级提升。

具身模型底层架构的「多频谱协同」 未来智能系统是不同时间尺度的融合：高频（50-100Hz）的运动控制（Locomotion）、中频（10-20Hz）的视觉动作协调（VLA）与低频的语言思维。系统需通过统一的「时钟」整合多感官信息。

中美具身智能竞争的「数据与组织」差异 中国在硬件基础和人力组织上有显著优势，能更高效完成千万小时级的行为数据采集与清洗。中美技术差距已缩小至 3-6 个月，且在端到端路径上正趋于共识。

科学家创业的「心力管理」与「不耗散」 引用老子「三宝」中的「俭」，强调创业者应通过学会说「不」来减少欲望和行事的耗散，保持内心评价标准的一致性，从而在处理技术与市场匹配时保持清醒。

💬 文章金句

- ChatGPT 的出现重塑了我的 AI 价值观：以前我们不知道智能在哪里，现在知道大量数据会造就智能。

泛化性是当前评价具身模型含金量的唯一核心指标。
我其实一直在思考如何避免心力的折损，因为心力的折损意味着重要的问题没有被透彻解答。
人不过是会思考的芦苇，即便你认为人是机器，拥有独特价值标准和快乐能力的个体也是不可替代的。

📊 文章信息

AI 评分：93

来源：信号与噪声

作者：信号与噪声

分类：人工智能

语言：中文

阅读时间：116 分钟

字数：28962

标签：具身智能, VLA 模型, Scaling Law, 千寻智能, 机器人

收听完整播客

E12.高阳：会思考的芦苇，会行动的机器｜北坡计划

🤖 問 AI