← 回總覽

E12.高阳:会思考的芦苇,会行动的机器|北坡计划

📅 2026-04-09 00:00 信号与噪声 人工智能 2 分鐘 1308 字 評分: 93
具身智能 VLA 模型 Scaling Law 千寻智能 机器人
📌 一句话摘要 对话千寻智能联创高阳,深度拆解具身智能的「GPT-3 时刻」、数据驱动的 Scaling Law 实践以及科学家创业的内在一致性。 📝 详细摘要 本期播客由绿洲资本张津剑对话千寻智能(SpiritAI)联合创始人、清华大学助理教授高阳。作为具身智能领域的顶尖学者,高阳分享了其从学术界转向产业界的认知升级:受 ChatGPT 启发,他坚信神经网络作为「通用函数拟合器」能将大模型的成功复制到物理交互领域。节目深入探讨了具身智能的技术路径,指出 2027 年将是具身智能的重大突破点。高阳详细对比了中美在数据收集(千万小时量级)、模型泛化性及 VLA(视觉-语言-动作)架构上的差异

📌 一句话摘要

对话千寻智能联创高阳,深度拆解具身智能的「GPT-3 时刻」、数据驱动的 Scaling Law 实践以及科学家创业的内在一致性。

📝 详细摘要

本期播客由绿洲资本张津剑对话千寻智能(SpiritAI)联合创始人、清华大学助理教授高阳。作为具身智能领域的顶尖学者,高阳分享了其从学术界转向产业界的认知升级:受 ChatGPT 启发,他坚信神经网络作为「通用函数拟合器」能将大模型的成功复制到物理交互领域。节目深入探讨了具身智能的技术路径,指出 2027 年将是具身智能的重大突破点。高阳详细对比了中美在数据收集(千万小时量级)、模型泛化性及 VLA(视觉-语言-动作)架构上的差异。此外,嘉宾还结合道家与佛教哲学,探讨了科学家创业者如何在高强度竞争中保持「心力不耗散」,强调「做自己」与内心稳定对于长期成功的决定性作用。

💡 主要观点

- 具身智能的 2027 年「GPT-3 时刻」预测 具身智能正从 GPT-2 水平向 GPT-3 跨越,核心指标在于泛化性。高阳预测 2027 年初将实现模型在任意场景下产生智能响应的突破,这依赖于从 1.5 万小时到千万小时级后训练数据的量级提升。

具身模型底层架构的「多频谱协同」 未来智能系统是不同时间尺度的融合:高频(50-100Hz)的运动控制(Locomotion)、中频(10-20Hz)的视觉动作协调(VLA)与低频的语言思维。系统需通过统一的「时钟」整合多感官信息。
中美具身智能竞争的「数据与组织」差异 中国在硬件基础和人力组织上有显著优势,能更高效完成千万小时级的行为数据采集与清洗。中美技术差距已缩小至 3-6 个月,且在端到端路径上正趋于共识。
科学家创业的「心力管理」与「不耗散」 引用老子「三宝」中的「俭」,强调创业者应通过学会说「不」来减少欲望和行事的耗散,保持内心评价标准的一致性,从而在处理技术与市场匹配时保持清醒。

💬 文章金句

- ChatGPT 的出现重塑了我的 AI 价值观:以前我们不知道智能在哪里,现在知道大量数据会造就智能。

  • 泛化性是当前评价具身模型含金量的唯一核心指标。
  • 我其实一直在思考如何避免心力的折损,因为心力的折损意味着重要的问题没有被透彻解答。
  • 人不过是会思考的芦苇,即便你认为人是机器,拥有独特价值标准和快乐能力的个体也是不可替代的。

📊 文章信息

AI 评分:93

来源:信号与噪声

作者:信号与噪声

分类:人工智能

语言:中文

阅读时间:116 分钟

字数:28962

标签: 具身智能, VLA 模型, Scaling Law, 千寻智能, 机器人

收听完整播客

查看原文 → 發佈: 2026-04-09 00:00:00 收錄: 2026-04-09 02:00:30

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。