本文在 Karpathy 的 4 条 CLAUDE.md 规则基础上,新增 4 条针对多步骤 Agent 工作流的规则(Token 预算、先读后写、每步检查点、大声失败),将错误率从 30% 降至 5%。
📝 详细摘要
文章以 Karpathy 提出的 4 条 CLAUDE.md 规则(先思考再编码、简单优先、手术式修改、目标驱动执行)为基础,指出这些规则主要解决单次交互中的失败模式,但在多步骤、自主 Agent 工作流中力不从心。作者结合自身实践,新增了 4 条针对 Agent 编排的执行层规则:硬性 Token 预算(防止死循环浪费 Token)、先读后写(避免重复造轮子)、每步检查点(阻断错误传播)、大声失败(暴露静默跳过的问题)。文章提供了完整的 CLAUDE.md 模板,并分享了 3 周实测效果:API 账单减半、代码质量显著提升、成功捕获数据迁移 bug。最终结论是 8 条规则联用可将错误率降至 5% 以下。
💡 主要观点
- Karpathy 的 4 条规则主要封堵单次交互中的失败模式。 包括静默假设、过度工程、正交损害等,约减少 40% 的单次提示失败,但对多步骤流水线中的错误传播和 Token 浪费无效。
💬 文章金句
- 没有预算的 Agent 会在同一个错误消息上消耗 5 万 Token 的上下文,直到它崩溃。
- 最昂贵的失败看起来和成功一模一样。
- CLAUDE.md 不是一个一次性文件。它是一个严格的行为合约,旨在关闭特定的、代价高昂的失败模式。
📊 文章信息
AI 初评:87
来源:王俊博客
作者:王俊博客
分类:人工智能
语言:中文
阅读时间:12 分钟
字数:2918
标签: AI Agent, AI 编程, LLM, 提示工程, 开发者工具