Anthropic 的三智能体架构设计支持长时间运行的全栈 AI 开发

📌 一句话摘要

Anthropic 推出的全新三智能体架构（规划、生成、评估）通过结构化的交接和独立的批判机制，解决了上下文丢失和评估偏差问题，从而实现了长时间运行的自主全栈开发。

📝 详细摘要

Anthropic 推出了一种专门用于长时间运行的自主应用开发的多智能体架构设计，涵盖前端设计和全栈开发。该框架将职责划分为三个不同的智能体：规划（Planning）、生成（Generation）和评估（Evaluation）。这种结构解决了 AI 编程中常见的挑战，例如上下文遗忘（context amnesia）以及模型倾向于高估自己工作成果的问题。通过实施基于结构化交接工件（handoff artifacts）的上下文重置，而非简单的上下文压缩，该系统能够在数小时的会话中保持高性能。评估智能体使用 Playwright MCP 等工具与实时界面进行交互，在 5-15 个周期内提供迭代反馈，以确保功能准确性和设计质量。

💡 主要观点

- 三智能体架构（规划、生成、评估）提高了长时间运行任务的可靠性。 通过分离关注点，系统避免了“自我评分”偏差，即生成器容易忽略自身错误，尤其是在 UI 设计和工艺等主观领域。

带有结构化交接的上下文重置解决了长会话中的“遗忘”问题。 该架构没有采用可能导致模型过度谨慎的上下文压缩方式，而是使用清晰的重置和交接工件，确保每个智能体都从定义明确的状态开始工作。

使用专业工具进行迭代评估，确保了高质量的前端输出。 评估智能体使用 Playwright MCP 与实时页面进行交互，在长达 4 小时的多次优化周期内，从设计质量、原创性、工艺和功能等方面对页面进行评分。

💬 文章金句

- 将执行工作的智能体与评判工作的智能体分离开来，被证明是解决这一问题的有力手段。

长时间运行的 AI 智能体失败的原因很简单：每一个新的上下文窗口都是一次遗忘。突破点在于结构。
该设计解决了自主编程工作流中常见的挑战，例如上下文丢失和任务过早终止。

📊 文章信息

AI 评分：89

来源：InfoQ

作者：Leela Kumili

分类：人工智能

语言：英文

阅读时间：2 分钟

字数：476

标签：多智能体系统, 自主编程, Anthropic, 软件工程, AI 智能体

阅读完整文章

Anthropic 的三智能体架构设计支持长时间运行的全栈 AI 开发

🤖 問 AI