OpenClaw 的 Peekaboo v3 为 Mac 端 AI Agent 提供了像素级屏幕识别和完整鼠标键盘操控能力,并支持 MCP 协议集成到 Cursor 等编程工具中。
📝 详细摘要
本文报道了 OpenClaw 团队发布的 Peekaboo v3 版本,这是一个为 Mac 设计的 Computer Use 工具包。Peekaboo v3 的核心能力包括像素级截图、读取 macOS UI 元素位置和类型,以及模拟点击、输入、快捷键、拖拽等人类操作。该工具支持自然语言 Agent 模式,并能将所有能力打包成 MCP Server,集成到 Cursor、Claude Code 等 AI 编程工具中,实现自动化 UI 调试。文章还介绍了四种使用方式:Homebrew 安装、MCP Server 接入、桌面版 App 和 Swift 库嵌入,以及通过 OpenClaw Skill 直接调用。
💡 主要观点
- Peekaboo v3 实现了 Mac 端的像素级屏幕识别和 UI 元素读取。 工具不仅能截取窗口、全屏、菜单栏的像素级截图,还能读取每个 UI 元素的位置、类型和 label,让 AI Agent 真正「看见」屏幕。
💬 文章金句
- Peekaboo v3 不仅能在 MAC 电脑上实现像素级截图,还能读取电脑上每个 UI 的位置。
- 让 Agent 真的能看,也真的能动,从指手画脚的甲方,变成真的能下场干活的乙方。
- Cursor 自己就能截图、自己看、自己改、自己再跑一遍验证,真·全程不用插手。
📊 文章信息
AI 初评:85
来源:量子位
作者:梦瑶
分类:人工智能
语言:中文
阅读时间:9 分钟
字数:2147
标签: OpenClaw, Peekaboo, Computer Use, MCP, AI Agent