Genesis AI 发布机器人基础模型 GENE-26.5,通过自研灵巧手、实时控制栈和全栈系统设计,在烹饪、实验室操作等复杂场景中展示了接近人类水平的灵巧操作能力。
📝 详细摘要
本文报道了 Genesis AI 最新发布的机器人基础模型 GENE-26.5。该模型在烹饪、实验室移液、解魔方、弹钢琴等多个复杂场景中展示了接近人类水平的灵巧操作能力,全程自主运行且使用同一模型。文章详细介绍了 Genesis 的全栈技术路线:自研的 20 自由度灵巧手(与人手 1:1 尺寸匹配)、自研实时控制栈(端到端延迟低至 3 毫秒)、三层数据引擎(手套数据、第一人称视频、互联网视频,已收集超 20 万小时多模态数据),以及基于 flow matching 的统一模型架构。团队强调操控是一个系统问题,选择每一层都自研。GENE-26.5 大多数复杂技能仅需不到 1 小时的任务专属数据,预训练规模越大,fine-tuning 越快、数据需求越少。文章还介绍了团队背景(CMU 博士周衔牵头,1.05 亿美元种子轮)和 Genesis 物理引擎的起源。
💡 主要观点
- GENE-26.5 展示了通用机器人系统在复杂灵巧操作任务上的突破。 模型在烹饪、实验室操作、解魔方、弹钢琴等场景中实现自主运行,单手打蛋、双手切番茄等任务展示了高精度灵巧操作,且大多数技能仅需不到 1 小时的任务专属数据。
💬 文章金句
- 操控不是一个纯模型训练问题,是一个系统问题。任何一层的短板都会传导到整个系统。
- Genesis 的解法很粗暴,把手做成一模一样,差距就消失了。
- 这只手套可以让实验室技术员、制造业工人在干日常工作的时候顺便采集数据,不打断工作流。
- 模型迭代速度的真正瓶颈是评估,仿真帮他们大幅加速了这个循环。
📊 文章信息
AI 初评:87
来源:量子位
作者:henry
分类:人工智能
语言:中文
阅读时间:14 分钟
字数:3399
标签: Genesis AI, 机器人, 灵巧手, 具身智能, 基础模型