逐际动力创始人张巍深度对话,探讨具身智能行业两年剧变,提出人形机器人应「服务于人」而非工业生产,并系统阐述世界模型、机器人大脑 OS 三层架构及技能化落地的独到方法论。
📝 详细摘要
本期播客是峰瑞资本产业观察栏目对逐际动力创始人张巍的第二次深度访谈。张巍从创始人视角回顾了具身智能行业过去两年的剧烈变化,强调机器人行业不应类比垂直互联网的「赢家通吃」逻辑,而更像互联网生态,各公司可在不同场景找到生存空间。在技术层面,张巍对「世界模型」进行祛魅,将其定义为基于当前状态和行动预测未来状态的模型,认为其本质上是一种数据 scaling 方向,对 VLA 范式是有益的拓展而非颠覆。他还提出一个颇具争议的观点:机器人大脑应被定义为操作系统而非模型,大脑负责调用各种模型(如 VLM、VLA)和技能来完成复杂任务。基于此,逐际动力构建了 System 2/1/0 三层架构,分别对应思考决策、技能和全身运动控制基础模型。在产品策略上,张巍提出「技能」是比「通用模型」更现实的落地路径,认为开车、剥鸡蛋等不同技能需要独立训练,不能依赖一个万能模型。在商业化展望上,他认为人形机器人的价值将沿着「无交互(表演)→弱交互(导览、导购)→强交互(家庭服务)」的路径展开,并借鉴无人机行业从专业拍摄到表演再到规模化降本的发展逻辑。此外,他还坦诚分享了从教授到创业者的五次蜕变经验,强调组织迭代的重要性和接受失败的勇气。
💡 主要观点
- 机器人行业不适用「赢家通吃」逻辑,更像互联网生态 张巍认为,具身智能赛道可以容纳大量玩家,不同公司在垂直场景中找到各自生态位,不需要像互联网平台那样只有第一名才能生存。
💬 文章金句
- 具身不应该类比单一垂直互联网赛道,而应类比整个互联网生态——可以美团、阿里、字节、腾讯等多家巨头并存。
- 大脑也不是模型,大脑是个操作系统。它要调用各种模型,包括 VLM、LM,才能去完成一个任务。
- 我们觉得具身的落地不能跟大模型那种先通用再专用,再应用在落地的方式,我觉得是不适合的。通用模型能力是慢慢长出来的,叫通用模型与场景数据的飞轮。
- 接受一件事情是可以失败的,接受一个公司甚至可以死这件事儿,我觉得是我个人来讲最大的一个成长,没有之一。
- 低成本动口不动手的商业服务、导览、导购,这些领域它可以替代聪明人的价值,是比替代体力工人更大的市场。
📊 文章信息
AI 初评:89
来源:高能量
作者:高能量
分类:人工智能
语言:中文
阅读时间:115 分钟
字数:28522
标签: 具身智能, 人形机器人, 世界模型, 机器人大脑, 逐际动力