← 回總覽

编程智能体的组成部分

📅 2026-04-04 19:45 Sebastian Raschka, PhD 人工智能 2 分鐘 1320 字 評分: 91
编程智能体 智能体框架 LLM 架构 上下文管理 软件工程
📌 一句话摘要 对编程智能体六大核心架构组件以及使 LLM 能够高效执行复杂工程任务的软件框架(harness)的技术深度解析。 📝 详细摘要 Sebastian Raschka 解释说,像 Claude Code 这样的编程智能体之所以表现出色,源于其“智能体框架”(agentic harness)——即围绕 LLM 构建的软件脚手架。他将该架构拆解为六大支柱:1) 用于工作区感知的实时代码库上下文(Live Repo Context);2) 降低计算成本的高效提示词缓存(Prompt Caching);3) 带有验证和权限控制的结构化工具使用(Structured Tool Use);

📌 一句话摘要

对编程智能体六大核心架构组件以及使 LLM 能够高效执行复杂工程任务的软件框架(harness)的技术深度解析。

📝 详细摘要

Sebastian Raschka 解释说,像 Claude Code 这样的编程智能体之所以表现出色,源于其“智能体框架”(agentic harness)——即围绕 LLM 构建的软件脚手架。他将该架构拆解为六大支柱:1) 用于工作区感知的实时代码库上下文(Live Repo Context);2) 降低计算成本的高效提示词缓存(Prompt Caching);3) 带有验证和权限控制的结构化工具使用(Structured Tool Use);4) 防止冗余的上下文压缩(Context Compaction);5) 用于持久化状态的结构化会话记忆(Structured Session Memory);以及 6) 通过子智能体实现的有限委派(Bounded Delegation)。文章强调,在编程任务中,模型表现出的“质量”往往归功于框架内卓越的上下文管理和系统设计。

💡 主要观点

- 智能体框架是区分原始 LLM 与功能性编程智能体的关键所在。 虽然 LLM 提供了推理引擎,但框架负责管理提示词、工具、文件状态和执行过程,将通用的聊天模型转化为能够进行代码库级操作的高效开发工具。

有效的上下文管理需要复杂的压缩和缓存策略来维持性能。 为了避免上下文膨胀和高昂成本,智能体必须截断过大的输出,对文件读取进行去重,并使用可由运行时缓存的稳定提示词前缀(指令和工具定义)。
带有程序化验证的结构化工具使用确保了智能体工作流的安全性和可靠性。 框架不再允许任意执行,而是提供了一组具有明确输入和边界的定义工具,并针对有效参数、文件路径和强制性用户审批环节实施检查。
会话记忆应分为工作记忆和完整记录,以实现任务的连续性。 工作记忆提供了一个精简的、以任务为中心的摘要,用于即时连续性;而完整记录则作为所有交互的持久、可恢复的档案,使智能体能够跨会话保持状态。

💬 文章金句

- 智能体是在环境中重复调用模型的系统。

  • 许多表象上的“模型质量”实际上是上下文质量。
  • 框架往往是决定一个 LLM 是否优于另一个的关键因素。
  • 编程框架是围绕模型构建的软件脚手架,帮助其高效地编写和编辑代码。

📊 文章信息

AI 评分:91

来源:Ahead of AI

作者:Sebastian Raschka, PhD

分类:人工智能

语言:英文

阅读时间:15 分钟

字数:3519

标签: 编程智能体, 智能体框架, LLM 架构, 上下文管理, 软件工程

阅读完整文章

查看原文 → 發佈: 2026-04-04 19:45:37 收錄: 2026-04-04 22:00:37

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。