本周技术周刊以 Agent 工程化全面落地为主线,梳理了 Anthropic、OpenAI、阿里、腾讯等厂商在 Coding 工具走出 IDE、Agent 评估与长时运行、Multi-Agent Harness 实战以及 AI Native 组织变革等方面的关键进展。
📝 详细摘要
本期周刊聚焦 Agent 工程化的全面落地,共收录 20 篇内容,其中 13 篇直接与 Agent 工程化相关。文章从四条主线展开:第一,Coding 工具走出编辑器,Anthropic 发布 Claude Code 在大型代码库中的工程实践、Agent View 多会话管理以及 Computer Use 最佳实践,OpenAI 则推出 Codex 的 Computer Use 功能和 Windows 沙箱方案;第二,Agent 评估与长时运行,Towards Data Science 基于 100 多次企业部署沉淀出 12 项评估指标框架,Google ADK 团队展示了长时运行 Agent 的架构方案,Agent Skill 开放标准已有 33+ 产品接入;第三,国内厂商 Multi-Agent Harness 集中爆发,PingCAP 复盘 TiDB Cloud 作为 Kimi K2.6 数据库后端的架构决策,腾讯云发布生产级 Multi-Agent Harness 全景图,阿里推出国内首个 Java Harness Framework AgentScope Java 1.1;第四,AI Native 组织与商业模式,阿里技术深度分析研发组织变革,Eric Ries 讨论公司治理的「财务引力」问题,以及 Manus AI、Suno、姚顺宇等一线人物的访谈。文章最后还对比了李想的宏大愿景与 flomo 少楠的真实困境,呈现 AI 在产业现场的两种姿态。
💡 主要观点
- Coding 工具正在走出编辑器,走向整个计算机。 Anthropic 和 OpenAI 本周同步发力,Claude Code 和 Codex 都推出了 Computer Use 功能,让 AI 能直接操作计算机,而非局限于 IDE 内部。Anthropic 强调放弃 RAG 嵌入式索引,改走 Agentic Search 路线,并提出了由 CLAUDE.md、Hooks、Skills 等组成的 Harness 架构。
💬 文章金句
- 放弃 RAG 嵌入式索引,改走 Agentic Search 路线,让 Claude 像工程师一样用 grep 跨引用导航。
- 评估基础设施绕不过去,它直接决定项目能不能上线。检索质量不行,下游再多 prompt 工程都救不回来。
- Agent 负责局部智能,Harness 负责全局控制。
- AI 是一种新的协作主体。所有过去以人形约束为前提设计的组织规则,前提开始失效了。
- 只有原来优秀的人变得更优秀了,因为 AI 无法回答一句话:『我不知道』。
📊 文章信息
AI 初评:86
来源:Gino Notes
作者:Gino
分类:人工智能
语言:中文
阅读时间:39 分钟
字数:9721
标签: Agent 工程化, Claude Code, Codex, Multi-Agent Harness, AI Native 组织