我们与开源顶流实验室一起聊了聊 Harness Design

📌 一句话摘要

本文通过访谈星舟无界创始团队，探讨了在模型能力快速提升背景下，AI Agent 基础设施（Harness Design）缺失的核心问题、设计原则与未来演进方向。

📝 详细摘要

文章围绕当前 AI Agent 领域的热点话题 Harness Design 展开深度访谈。受访者星舟无界创始团队（石宇、汤嘉斌、黄超）指出，随着大模型能力指数级提升，瓶颈已从模型智能转向支撑其长期、稳定、协作运行的基础设施缺失。文章系统剖析了当前 Agent 系统在身份、群组环境、可验证性（信任）三个维度的根本性缺失，并批判了将 Harness 简单理解为“驾驭”工具的视角。团队提出了 Harness 设计的核心原则：尊重模型（遵循苦涩教训）、尊重评测、以及最终应优化掉自身（变得透明）。文章还探讨了 Harness 与模型能力的边界（执行/状态会被模型吃掉，时间/关系则不会），并从推荐系统、RAG 到 Agent 的技术演进路径，论证了构建统一、开放的 Agent 基础设施的必要性与创业机会。最后，通过一次失败的多 Agent 协作实验，反思了不应简单将人类协作软件范式套用于 Agent 的设计理念。

💡 主要观点

- 当前 AI Agent 发展的核心瓶颈是基础设施缺失，而非模型智能不足。 模型能力已远超现有基础设施的承载能力，导致 Agent 缺乏持久的身份、有效的群组协作环境以及任务完成的可验证性，使其无法积累经验、形成稳定协作并融入经济体系。

Harness 设计的核心是提供 Agent 生长的“土壤”，而非“驾驭”Agent 的“缰绳”。 应摒弃以人类为中心的控制思维，转向以 Agent 为视角的设计（Agent perspective Design），目标是构建能让 Agent 自主、长程运行的基础层（substrate），并最终让这一层对用户透明。

Harness 优化的第一性原理是“尊重模型”和“尊重评测”。 尊重模型意味着遵循苦涩教训，避免用固化的、富含人类先验的工作流束缚智能模型；尊重评测则强调所有优化都应以可量化的评估指标为驱动，确保改进的有效性。

未来 Agent 基础设施将趋于统一和开放，这反而会催生上层应用的繁荣。 一个稳定、开源的基础设施层（类似 LiteLLM 之于模型）能解放开发者，让他们专注于构建差异化的上层应用，正如 iOS/Android 统一移动生态后催生了 Facebook、Instagram 等巨头。

💬 文章金句

- 模型跑太快，基础设施被甩下车了。

今天的 Agent 就还停留在那个聊天室时代，每个 Session 结束，它就消失了，什么都没留下。
Harness（马具）这个比喻很诚实，它描述的就是一种控制关系……但它们只是在同一个框架内的局部优化，并没有挑战框架本身。
评判标准可以浓缩成一句话：它有没有让 Agent 离目标更近，同时让人离 Loop 更远？
所有跟‘执行’和‘状态’有关的东西，最终都会被模型吃掉……但有两样东西不会被吃掉：跟‘时间’和‘关系’有关的东西。

📊 文章信息

AI 初评：87

来源：Z Potentials

作者：Z Potentials

分类：人工智能

语言：中文

阅读时间：23 分钟

字数：5583

标签： Harness Design, AI Agent, 基础设施, Agent 协作, 模型能力

阅读完整文章

我们与开源顶流实验室一起聊了聊 Harness Design

🤖 問 AI