← 回總覽

Karpathy 的 4 条 CLAUDE.md 规则减少 30%错误,我加了 4 条后降到 5%

📅 2026-06-06 00:00 王俊博客 人工智能 2 分鐘 1318 字 評分: 87
AI Agent AI 编程 LLM 提示工程 开发者工具
📌 一句话摘要 本文在 Karpathy 的 4 条 CLAUDE.md 规则基础上,新增 4 条针对多步骤 Agent 工作流的规则(Token 预算、先读后写、每步检查点、大声失败),将错误率从 30% 降至 5%。 📝 详细摘要 文章以 Karpathy 提出的 4 条 CLAUDE.md 规则(先思考再编码、简单优先、手术式修改、目标驱动执行)为基础,指出这些规则主要解决单次交互中的失败模式,但在多步骤、自主 Agent 工作流中力不从心。作者结合自身实践,新增了 4 条针对 Agent 编排的执行层规则:硬性 Token 预算(防止死循环浪费 Token)、先读后写(避免重复造轮

📌 一句话摘要

本文在 Karpathy 的 4 条 CLAUDE.md 规则基础上,新增 4 条针对多步骤 Agent 工作流的规则(Token 预算、先读后写、每步检查点、大声失败),将错误率从 30% 降至 5%。

📝 详细摘要

文章以 Karpathy 提出的 4 条 CLAUDE.md 规则(先思考再编码、简单优先、手术式修改、目标驱动执行)为基础,指出这些规则主要解决单次交互中的失败模式,但在多步骤、自主 Agent 工作流中力不从心。作者结合自身实践,新增了 4 条针对 Agent 编排的执行层规则:硬性 Token 预算(防止死循环浪费 Token)、先读后写(避免重复造轮子)、每步检查点(阻断错误传播)、大声失败(暴露静默跳过的问题)。文章提供了完整的 CLAUDE.md 模板,并分享了 3 周实测效果:API 账单减半、代码质量显著提升、成功捕获数据迁移 bug。最终结论是 8 条规则联用可将错误率降至 5% 以下。

💡 主要观点

- Karpathy 的 4 条规则主要封堵单次交互中的失败模式。 包括静默假设、过度工程、正交损害等,约减少 40% 的单次提示失败,但对多步骤流水线中的错误传播和 Token 浪费无效。

硬性 Token 预算可防止 Agent 在死循环中浪费资源。 作者设定每任务 4,000 Token、每会话 30,000 Token 的预算,超支强制总结重启,实测 API 账单减半。
每步检查点规则是阻断多步骤错误传播的关键。 Agent 每完成一个重要步骤必须总结已验证和剩余内容,避免在错误状态上继续执行,大幅提升代码质量。
「大声失败」规则能暴露被静默跳过的关键问题。 Agent 默认暴露不确定性,任何跳过内容必须主动报告,作者借此发现了一个手动 review 无法察觉的数据迁移 bug。

💬 文章金句

- 没有预算的 Agent 会在同一个错误消息上消耗 5 万 Token 的上下文,直到它崩溃。

  • 最昂贵的失败看起来和成功一模一样。
  • CLAUDE.md 不是一个一次性文件。它是一个严格的行为合约,旨在关闭特定的、代价高昂的失败模式。

📊 文章信息

AI 初评:87

来源:王俊博客

作者:王俊博客

分类:人工智能

语言:中文

阅读时间:12 分钟

字数:2918

标签: AI Agent, AI 编程, LLM, 提示工程, 开发者工具

阅读完整文章

查看原文 → 發佈: 2026-06-06 00:00:00 收錄: 2026-06-06 16:00:11

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。