← 回總覽

Holo3:突破计算机使用边界

📅 2026-04-02 00:36 Ramzi De Coster, Pierre-Louis Cedoz 人工智能 2 分鐘 1316 字 評分: 90
Holo3 计算机使用 AI 智能体 OSWorld 混合专家模型 (MoE)
📌 一句话摘要 Hcompany 推出了 Holo3,这是一款专用的 MoE 模型,通过独特的合成训练飞轮和环境工厂,在 OSWorld 计算机使用基准测试中达到了 SOTA 水平。 📝 详细摘要 Holo3 是一个专为“自主企业”设计的新型模型系列,专注于桌面计算机导航和任务执行。旗舰模型 Holo3-122B-A10B 在 OSWorld-Verified 基准测试中取得了 78.85% 的破纪录成绩。它采用了混合专家(MoE)架构,仅需 10B 激活参数,以低于大型专有模型的成本提供了高性能。其核心创新在于“智能体学习飞轮”(Agentic Learning Flywheel),利用

📌 一句话摘要

Hcompany 推出了 Holo3,这是一款专用的 MoE 模型,通过独特的合成训练飞轮和环境工厂,在 OSWorld 计算机使用基准测试中达到了 SOTA 水平。

📝 详细摘要

Holo3 是一个专为“自主企业”设计的新型模型系列,专注于桌面计算机导航和任务执行。旗舰模型 Holo3-122B-A10B 在 OSWorld-Verified 基准测试中取得了 78.85% 的破纪录成绩。它采用了混合专家(MoE)架构,仅需 10B 激活参数,以低于大型专有模型的成本提供了高性能。其核心创新在于“智能体学习飞轮”(Agentic Learning Flywheel),利用“合成环境工厂”(Synthetic Environment Factory)生成多样化、可验证的企业场景,用于训练跨多个应用程序的感知和多步推理能力。

💡 主要观点

- 计算机使用基准测试中的 SOTA 表现 Holo3-122B-A10B 在 OSWorld-Verified 上取得了 78.85% 的分数,树立了新的行业标准,在桌面导航方面超越了规模大得多的模型。

通过 MoE 架构实现高效 通过使用总参数 122B、激活参数 10B 的混合专家设计,Holo3 以 GPT-5 或 Opus 等模型推理成本的一小部分,提供了顶级的智能体能力。
智能体学习飞轮与合成工厂 该模型使用专有的流水线进行训练,从零开始生成合成企业环境,从而为复杂工作流提供可扩展、可验证且多样化的训练数据。
先进的多应用推理 Holo3 展示了跨不同系统协调信息的能力,例如解析 PDF、检查预算以及发送个性化电子邮件,且不会丢失状态。

💬 文章金句

- Holo3-122B-A10B 在领先的桌面计算机使用基准测试中为行业树立了新的 SOTA 标准。

  • Holo3 仅以 10B 激活参数(总计 122B)实现了这一点,因此其成本仅为大型专有模型的一小部分。
  • 我们的环境是使用编码智能体自动构建的,这些智能体根据场景规范从零开始编写网站代码,从而产生可验证的任务。
  • 虽然 Holo3 目前已经掌握了界面操作,但我们已经在致力于下一个前沿领域:自适应智能体(Adaptive Agency)。

📊 文章信息

AI 评分:90

来源:Hugging Face Blog

作者:Ramzi De Coster, Pierre-Louis Cedoz

分类:人工智能

语言:英文

阅读时间:3 分钟

字数:661

标签: Holo3, 计算机使用, AI 智能体, OSWorld, 混合专家模型 (MoE)

阅读完整文章

查看原文 → 發佈: 2026-04-02 00:36:15 收錄: 2026-04-02 02:00:33

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。