← 回總覽

物理 AI 的早期答案,可能先出现在工厂里

📅 2026-05-28 18:28 极客公园 人工智能 2 分鐘 1466 字 評分: 86
工业具身智能 VLA 微亿智造 物理 AI 机械臂
📌 一句话摘要 本文通过深度对话微亿智造 CEO,探讨了工业具身智能的真实落地路径:VLA 并非唯一答案,技术工种依赖小模型与规则引擎,普工场景才逐步引入端到端技术,而 ROI 可计算才是工业第一性原理。 📝 详细摘要 本文是极客公园对微亿智造董事长兼 CEO 张志琦的深度专访。文章从微亿智造 2018 年将 AI 引入传统机械臂的历程切入,详细阐述了工业具身智能与传统自动化的本质区别——「看见-判断-处理」的能力闭环。作者通过外观检测、打磨、装配等真实案例,展示了具身智能如何解决传统机械臂无法应对的柔性生产问题。文章重点讨论了 VLA 技术在工业场景中的局限性:精度仅达厘米级,无法满足

📌 一句话摘要

本文通过深度对话微亿智造 CEO,探讨了工业具身智能的真实落地路径:VLA 并非唯一答案,技术工种依赖小模型与规则引擎,普工场景才逐步引入端到端技术,而 ROI 可计算才是工业第一性原理。

📝 详细摘要

本文是极客公园对微亿智造董事长兼 CEO 张志琦的深度专访。文章从微亿智造 2018 年将 AI 引入传统机械臂的历程切入,详细阐述了工业具身智能与传统自动化的本质区别——「看见-判断-处理」的能力闭环。作者通过外观检测、打磨、装配等真实案例,展示了具身智能如何解决传统机械臂无法应对的柔性生产问题。文章重点讨论了 VLA 技术在工业场景中的局限性:精度仅达厘米级,无法满足 0.1 毫米的工业要求;技术工种更适合基于规则引擎和小模型(百亿参数级)的方案,普工场景才逐步试点端到端技术。文章还探讨了触觉技术的瓶颈、海外市场拓展、以及未来竞争格局——中长期看,竞争对手将是越来越不像人的人形机器人公司。核心观点是:工业场景会是物理 AI 相对更早落地的方向,但爆发仍需等待工厂人力减少 4/5。

💡 主要观点

- 工业具身智能的核心是「看见-判断-处理」的能力闭环,而非机械臂形态。 传统机械臂按预设轨迹执行,而具身智能能像人一样先识别目标和缺陷,再决定处理方案并生成轨迹,这是两者本质区别。

VLA 并非工业场景的唯一答案,技术工种更适合小模型与规则引擎。 VLA 精度仅达厘米级,无法满足 0.1 毫米的工业要求。打磨、焊接等技术工种场景,百亿参数级模型加规则引擎即可高效解决问题。
ROI 可计算是工业场景的第一性原理,客户买单是检验标准。 工业客户关注的是能否在可计算 ROI 的情况下解决问题,而非技术形态是否前沿。微亿智造通过真实订单增长验证了工业具身智能的商业可行性。
触觉是工业具身智能的下一个技术瓶颈,其发展远落后于视觉。 插拔、理线等任务依赖触觉反馈,但触觉模型技术远低于视觉。微亿智造已在探索霍尔和视触觉两条技术路线,触觉模型加入后将改变整个模型架构。

💬 文章金句

- 差距不在机械臂速度,而在判断能力。人会先看哪里有问题,再只处理有缺陷的位置;传统机械臂则只能按预设路径把所有位置走完。

  • 不是所有场景都需要上一个最大的模型,也不是所有场景都应该被 VLA 覆盖。
  • 在 ROI 可计算的情况下能不能完成,这是最基本的工业第一性原理。
  • 以前工厂是把人当机器。质检对眼睛伤害很大,强光下看产品,20 多岁的小姑娘看两年,眼睛可能就不行了。
  • 有脑和没脑的机械臂差别很大。

📊 文章信息

AI 初评:86

来源:极客公园

作者:极客公园

分类:人工智能

语言:中文

阅读时间:22 分钟

字数:5370

标签: 工业具身智能, VLA, 微亿智造, 物理 AI, 机械臂

阅读完整文章

查看原文 → 發佈: 2026-05-28 18:28:00 收錄: 2026-05-29 08:00:12

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。