本文通过完整实测,深入分析了腾讯 Marvis 桌面 AI 助手的技术架构、各子 Agent 的实际能力边界,并探讨了「Agent OS」这一概念的真实含义与行业现状。
📝 详细摘要
文章对腾讯 PCG 应用宝团队推出的 Marvis 进行了系统性实测。Marvis 定位为「操作系统层级 AI 助手」,采用父-子 Agent 架构,包含 Computer、App、Browser、File、Search 五个子 Agent。实测发现:Computer Agent 在预建 MCP 工具覆盖的场景下体验丝滑,但无工具时退化为 LLM 写 shell 脚本;App Agent 受限于 macOS 的 TCC 安全机制和 Apple Music 的 DRM 保护,无法完成复杂 GUI 操控;Browser Agent 基于 CDP/Playwright 技术路径最为成熟。文章还验证了 Marvis 的并行调度能力,它能自动进行任务依赖分析和并行派发。最终结论认为,Marvis 是一个优秀的桌面 Agent 产品,通过预配置工具和精心设计的交互降低了使用门槛,但在技术上并未超出已知范畴。文章深入探讨了「Agent OS」的本质,指出真正的 Agent OS 应管理任务、上下文、能力和授权,而 Marvis 仍跑在传统 OS 之上,受其权限限制。
💡 主要观点
- Marvis 的 Computer Agent 在预建 MCP 工具覆盖的场景下体验丝滑,无工具时则退化为 LLM 临场写 shell 脚本。 预建工具库是 Marvis 的核心差异化优势,大幅降低了普通用户使用 Agent 操作电脑的成本,但其可靠性完全取决于工具库的覆盖范围。
💬 文章金句
- 同一个词,至少五种完全不同的含义。
- Marvis 虽然自称「OS 级」,但在 macOS 看来它就是一个普通的第三方 app。
- Marvis 的价值在于:用户说「调快触控板」,LLM 直接匹配到这个工具,不需要知道任何终端命令,极致便捷。
- 两个产品撞的是同一面墙:macOS 的 TCC 安全机制。
- 想当 OS,但跑在别人的 OS 上面。
📊 文章信息
AI 初评:88
来源:十字路口Crossing
作者:十字路口Crossing
分类:人工智能
语言:中文
阅读时间:15 分钟
字数:3739
标签: Marvis, 腾讯, Agent OS, 桌面 AI 助手, AI 产品评测