BestBlogs 周刊 | 第 95 期：Agent 工程化的全面落地

📌 一句话摘要

本周技术周刊以 Agent 工程化全面落地为主线，梳理了 Anthropic、OpenAI、阿里、腾讯等厂商在 Coding 工具走出 IDE、Agent 评估与长时运行、Multi-Agent Harness 实战以及 AI Native 组织变革等方面的关键进展。

📝 详细摘要

本期周刊聚焦 Agent 工程化的全面落地，共收录 20 篇内容，其中 13 篇直接与 Agent 工程化相关。文章从四条主线展开：第一，Coding 工具走出编辑器，Anthropic 发布 Claude Code 在大型代码库中的工程实践、Agent View 多会话管理以及 Computer Use 最佳实践，OpenAI 则推出 Codex 的 Computer Use 功能和 Windows 沙箱方案；第二，Agent 评估与长时运行，Towards Data Science 基于 100 多次企业部署沉淀出 12 项评估指标框架，Google ADK 团队展示了长时运行 Agent 的架构方案，Agent Skill 开放标准已有 33+ 产品接入；第三，国内厂商 Multi-Agent Harness 集中爆发，PingCAP 复盘 TiDB Cloud 作为 Kimi K2.6 数据库后端的架构决策，腾讯云发布生产级 Multi-Agent Harness 全景图，阿里推出国内首个 Java Harness Framework AgentScope Java 1.1；第四，AI Native 组织与商业模式，阿里技术深度分析研发组织变革，Eric Ries 讨论公司治理的「财务引力」问题，以及 Manus AI、Suno、姚顺宇等一线人物的访谈。文章最后还对比了李想的宏大愿景与 flomo 少楠的真实困境，呈现 AI 在产业现场的两种姿态。

💡 主要观点

- Coding 工具正在走出编辑器，走向整个计算机。 Anthropic 和 OpenAI 本周同步发力，Claude Code 和 Codex 都推出了 Computer Use 功能，让 AI 能直接操作计算机，而非局限于 IDE 内部。Anthropic 强调放弃 RAG 嵌入式索引，改走 Agentic Search 路线，并提出了由 CLAUDE.md、Hooks、Skills 等组成的 Harness 架构。

Agent 工程化落地必须通过评估和长时运行两道关。 Towards Data Science 基于 100 多次企业部署沉淀出 12 项评估指标框架，涵盖检索、生成、Agent 行为和生产侧四个层面。Google ADK 团队则展示了长时运行 Agent 的架构方案，包括结构化记忆 schema、事件驱动的休眠门和多智能体委派。

国内厂商在 Multi-Agent Harness 领域集中爆发。 PingCAP 复盘 TiDB Cloud 作为 Kimi K2.6 数据库后端的架构决策，提出 one agent， one sandbox， one storage， one database 范式。腾讯云发布生产级 Multi-Agent Harness 全景图，阿里推出国内首个 Java Harness Framework AgentScope Java 1.1。

AI Native 时代研发组织正在发生根本性变革。 阿里技术分析显示，AI 深度使用后写代码占比从 30% 降到 5%，与 Agent 对话占比升至 60%。组织形态正从传统层级结构转向两层结构：高度结构化的 Harness 层和高度松散的 Hive Mind 层，Execution Graph 正在替代 Org Chart。

AI 在真实产业现场呈现宏大愿景与真实困境并存的两种姿态。 李想将理想汽车定位为 AI + 具身智能公司，而 flomo 少楠则指出效率提升后用户价值并未同步跟上，团队协作重构比工具升级更难。两者对比呈现了 AI 落地过程中的机遇与挑战。

💬 文章金句

- 放弃 RAG 嵌入式索引，改走 Agentic Search 路线，让 Claude 像工程师一样用 grep 跨引用导航。

评估基础设施绕不过去，它直接决定项目能不能上线。检索质量不行，下游再多 prompt 工程都救不回来。
Agent 负责局部智能，Harness 负责全局控制。
AI 是一种新的协作主体。所有过去以人形约束为前提设计的组织规则，前提开始失效了。
只有原来优秀的人变得更优秀了，因为 AI 无法回答一句话：『我不知道』。

📊 文章信息

AI 初评：86

来源：Gino Notes

作者：Gino

分类：人工智能

语言：中文

阅读时间：39 分钟

字数：9721

标签： Agent 工程化, Claude Code, Codex, Multi-Agent Harness, AI Native 组织

阅读完整文章

BestBlogs 周刊 | 第 95 期：Agent 工程化的全面落地

🤖 問 AI