戴盟机器人完成亿元融资，阿里通义多模态大牛加盟攻关物理世界模型

📌 一句话摘要

戴盟机器人完成亿元 A 轮融资，并引入阿里通义前多模态专家原玮浩，以触觉模态为核心攻关物理世界模型，试图补齐具身智能在真实物理交互中的关键数据缺口。

📝 详细摘要

本文报道了具身智能公司戴盟机器人完成亿元 A 轮融资的消息，投资方为汇川产投和中国电信。文章重点介绍了戴盟的技术路线选择：与当前行业主流的视觉、VLA 路线不同，戴盟将触觉作为核心模态，认为触觉是 Physical AI 理解物理世界的关键入口。同时，阿里通义实验室前多模态研究专家原玮浩加入戴盟担任首席 AI 科学家。文章详细阐述了戴盟对物理世界模型的定义——以多模态接触状态为条件预测未来，不仅预测画面帧变化，还包括触觉信号、接触状态和操作成败。戴盟将物理接触拆分为认知层（多模态对齐）和执行层（高频触觉伺服+物理世界推理）两层。文章还讨论了触觉路线的两大难点：规模化数据采集和多模态数据对齐，以及戴盟的应对方案，包括外发式数据采集网络和联合发布的含触觉全模态评测基准。

💡 主要观点

- 戴盟机器人完成亿元 A 轮融资，阿里通义前多模态专家原玮浩加入担任首席 AI 科学家。 融资由汇川产投和中国电信联合投资，资金将投向物理世界模型研发、含触觉全模态数据集和真实场景数据飞轮。原玮浩的加入强化了戴盟在多模态大模型与机器人物理操作结合方面的技术实力。

戴盟选择以触觉为核心模态，区别于行业主流的纯视觉路线。 公司认为视觉和语言是物理世界的低维映射，触觉才是理解物理世界的关键入口。很多决定操作成败的信息（如物体软硬、表面光滑度、抓握力）只有在接触后才能获得，纯视觉难以稳定推断。

戴盟的物理世界模型以多模态接触状态为条件预测未来，不仅预测画面，还预测触觉信号和操作成败。 该模型关注下一时刻的触觉信号、接触状态以及操作是否失败、失败原因和修正策略，比常规视频世界模型增加了物理交互维度的预测能力。

触觉路线面临规模化数据采集和多模态对齐两大核心难点。 触觉数据需要覆盖不同材质、形状和接触方式的多样性，而非单一物体的重复操作。同时，触觉、视觉、关节角度等多模态数据必须在毫秒级严格同步，否则模型学到的因果关系可能错误。

戴盟通过外发式数据采集网络和联合发布评测基准来推动触觉 Scaling Law。 公司搭建了标准化采集模组部署到产业合作方场景，并联合 Google DeepMind 等机构发布全球最大含触觉全模态数据集 Daimon-Infinity。同时与银河通用发布首个含触觉全模态物理交互评测基准 RobOmni，为触觉 Scaling Law 建立公认标尺。

💬 文章金句

- 触觉是 Physical AI 理解真实世界的关键入口。

我们的物理世界模型，它以多模态接触状态为条件来预测未来。
简单来说，视频世界模型在预测画面，我们在预测物理交互。
只有加入触觉模态，才能够让语言和视觉真正具有物理意义，才能够让模型真正理解并操作物理世界。

📊 文章信息

AI 初评：84

来源：量子位

作者：衡宇

分类：人工智能

语言：中文

阅读时间：9 分钟

字数：2186

标签：具身智能, 机器人, AI Agent, 多模态AI, 世界模型

阅读完整文章

戴盟机器人完成亿元融资，阿里通义多模态大牛加盟攻关物理世界模型

🤖 問 AI