Hcompany 推出了 Holo3,这是一款专用的 MoE 模型,通过独特的合成训练飞轮和环境工厂,在 OSWorld 计算机使用基准测试中达到了 SOTA 水平。
📝 详细摘要
Holo3 是一个专为“自主企业”设计的新型模型系列,专注于桌面计算机导航和任务执行。旗舰模型 Holo3-122B-A10B 在 OSWorld-Verified 基准测试中取得了 78.85% 的破纪录成绩。它采用了混合专家(MoE)架构,仅需 10B 激活参数,以低于大型专有模型的成本提供了高性能。其核心创新在于“智能体学习飞轮”(Agentic Learning Flywheel),利用“合成环境工厂”(Synthetic Environment Factory)生成多样化、可验证的企业场景,用于训练跨多个应用程序的感知和多步推理能力。
💡 主要观点
- 计算机使用基准测试中的 SOTA 表现 Holo3-122B-A10B 在 OSWorld-Verified 上取得了 78.85% 的分数,树立了新的行业标准,在桌面导航方面超越了规模大得多的模型。
💬 文章金句
- Holo3-122B-A10B 在领先的桌面计算机使用基准测试中为行业树立了新的 SOTA 标准。
- Holo3 仅以 10B 激活参数(总计 122B)实现了这一点,因此其成本仅为大型专有模型的一小部分。
- 我们的环境是使用编码智能体自动构建的,这些智能体根据场景规范从零开始编写网站代码,从而产生可验证的任务。
- 虽然 Holo3 目前已经掌握了界面操作,但我们已经在致力于下一个前沿领域:自适应智能体(Adaptive Agency)。
📊 文章信息
AI 评分:90
来源:Hugging Face Blog
作者:Ramzi De Coster, Pierre-Louis Cedoz
分类:人工智能
语言:英文
阅读时间:3 分钟
字数:661
标签: Holo3, 计算机使用, AI 智能体, OSWorld, 混合专家模型 (MoE)