Browser Use 在 Online-Mind2Web 基准测试中取得了 97% 的得分,通过利用 Karpathy 的 Auto-Research 方法成功改进了产品。
📝 详细摘要
Browser Use 团队宣布了一项重大技术里程碑,在 Online-Mind2Web 浏览器智能体基准测试中以 97% 的得分达到了业界领先水平(SOTA)。他们详细介绍了其方法论,即利用 Andrej Karpathy 的 Auto-Research(Claude Code 循环机制)来迭代和改进产品,为其他开发者提供了可参考的实践案例。
📊 文章信息
AI 评分:86
来源:Browser Use(@browser_use)
作者:Browser Use
分类:人工智能
语言:英文
阅读时间:2 分钟
字数:264
标签: BrowserUse, AI 智能体, SOTA, Online-Mind2Web, ClaudeCode