← 回總覽

一年磨一剑,今年最炸机器人 Demo 来了!

📅 2026-05-07 14:43 henry 人工智能 2 分鐘 1515 字 評分: 87
Genesis AI 机器人 灵巧手 具身智能 基础模型
📌 一句话摘要 Genesis AI 发布机器人基础模型 GENE-26.5,通过自研灵巧手、实时控制栈和全栈系统设计,在烹饪、实验室操作等复杂场景中展示了接近人类水平的灵巧操作能力。 📝 详细摘要 本文报道了 Genesis AI 最新发布的机器人基础模型 GENE-26.5。该模型在烹饪、实验室移液、解魔方、弹钢琴等多个复杂场景中展示了接近人类水平的灵巧操作能力,全程自主运行且使用同一模型。文章详细介绍了 Genesis 的全栈技术路线:自研的 20 自由度灵巧手(与人手 1:1 尺寸匹配)、自研实时控制栈(端到端延迟低至 3 毫秒)、三层数据引擎(手套数据、第一人称视频、互联网视频,

📌 一句话摘要

Genesis AI 发布机器人基础模型 GENE-26.5,通过自研灵巧手、实时控制栈和全栈系统设计,在烹饪、实验室操作等复杂场景中展示了接近人类水平的灵巧操作能力。

📝 详细摘要

本文报道了 Genesis AI 最新发布的机器人基础模型 GENE-26.5。该模型在烹饪、实验室移液、解魔方、弹钢琴等多个复杂场景中展示了接近人类水平的灵巧操作能力,全程自主运行且使用同一模型。文章详细介绍了 Genesis 的全栈技术路线:自研的 20 自由度灵巧手(与人手 1:1 尺寸匹配)、自研实时控制栈(端到端延迟低至 3 毫秒)、三层数据引擎(手套数据、第一人称视频、互联网视频,已收集超 20 万小时多模态数据),以及基于 flow matching 的统一模型架构。团队强调操控是一个系统问题,选择每一层都自研。GENE-26.5 大多数复杂技能仅需不到 1 小时的任务专属数据,预训练规模越大,fine-tuning 越快、数据需求越少。文章还介绍了团队背景(CMU 博士周衔牵头,1.05 亿美元种子轮)和 Genesis 物理引擎的起源。

💡 主要观点

- GENE-26.5 展示了通用机器人系统在复杂灵巧操作任务上的突破。 模型在烹饪、实验室操作、解魔方、弹钢琴等场景中实现自主运行,单手打蛋、双手切番茄等任务展示了高精度灵巧操作,且大多数技能仅需不到 1 小时的任务专属数据。

Genesis 采用全栈自研策略,从硬件到算法层层打通。 团队自研 20 自由度灵巧手(与人手 1:1 尺寸匹配)、实时控制栈(端到端延迟 3 毫秒)、三层数据引擎和统一模型架构,认为操控是系统问题,任何一层的短板都会传导到整个系统。
数据引擎采用三层帕累托分布,已收集超 20 万小时多模态数据。 手套数据提供最高保真度的手部运动和触觉信号,第一人称视频捕捉自然行为,互联网视频提供海量覆盖,三层数据在质量和规模上做了帕累托分布,支持异构数据联合训练。
预训练规模与 fine-tuning 效率呈正相关,仿真加速评估循环。 预训练数据量越大,zero-shot 泛化能力越强,fine-tuning 数据需求越少。Genesis 物理引擎用于大规模闭环评估,大幅加速了模型迭代。

💬 文章金句

- 操控不是一个纯模型训练问题,是一个系统问题。任何一层的短板都会传导到整个系统。

  • Genesis 的解法很粗暴,把手做成一模一样,差距就消失了。
  • 这只手套可以让实验室技术员、制造业工人在干日常工作的时候顺便采集数据,不打断工作流。
  • 模型迭代速度的真正瓶颈是评估,仿真帮他们大幅加速了这个循环。

📊 文章信息

AI 初评:87

来源:量子位

作者:henry

分类:人工智能

语言:中文

阅读时间:14 分钟

字数:3399

标签: Genesis AI, 机器人, 灵巧手, 具身智能, 基础模型

阅读完整文章

查看原文 → 發佈: 2026-05-07 14:43:41 收錄: 2026-05-07 18:00:38

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。