Karpathy 的 4 条 CLAUDE.md 规则减少 30%错误，我加了 4 条后降到 5%

📌 一句话摘要

本文在 Karpathy 的 4 条 CLAUDE.md 规则基础上，新增 4 条针对多步骤 Agent 工作流的规则（Token 预算、先读后写、每步检查点、大声失败），将错误率从 30% 降至 5%。

📝 详细摘要

文章以 Karpathy 提出的 4 条 CLAUDE.md 规则（先思考再编码、简单优先、手术式修改、目标驱动执行）为基础，指出这些规则主要解决单次交互中的失败模式，但在多步骤、自主 Agent 工作流中力不从心。作者结合自身实践，新增了 4 条针对 Agent 编排的执行层规则：硬性 Token 预算（防止死循环浪费 Token）、先读后写（避免重复造轮子）、每步检查点（阻断错误传播）、大声失败（暴露静默跳过的问题）。文章提供了完整的 CLAUDE.md 模板，并分享了 3 周实测效果：API 账单减半、代码质量显著提升、成功捕获数据迁移 bug。最终结论是 8 条规则联用可将错误率降至 5% 以下。

💡 主要观点

- Karpathy 的 4 条规则主要封堵单次交互中的失败模式。 包括静默假设、过度工程、正交损害等，约减少 40% 的单次提示失败，但对多步骤流水线中的错误传播和 Token 浪费无效。

硬性 Token 预算可防止 Agent 在死循环中浪费资源。 作者设定每任务 4，000 Token、每会话 30，000 Token 的预算，超支强制总结重启，实测 API 账单减半。

每步检查点规则是阻断多步骤错误传播的关键。 Agent 每完成一个重要步骤必须总结已验证和剩余内容，避免在错误状态上继续执行，大幅提升代码质量。

「大声失败」规则能暴露被静默跳过的关键问题。 Agent 默认暴露不确定性，任何跳过内容必须主动报告，作者借此发现了一个手动 review 无法察觉的数据迁移 bug。

💬 文章金句

- 没有预算的 Agent 会在同一个错误消息上消耗 5 万 Token 的上下文，直到它崩溃。

最昂贵的失败看起来和成功一模一样。
CLAUDE.md 不是一个一次性文件。它是一个严格的行为合约，旨在关闭特定的、代价高昂的失败模式。

📊 文章信息

AI 初评：87

来源：王俊博客

作者：王俊博客

分类：人工智能

语言：中文

阅读时间：12 分钟

字数：2918

标签： AI Agent, AI 编程, LLM, 提示工程, 开发者工具

阅读完整文章

Karpathy 的 4 条 CLAUDE.md 规则减少 30%错误，我加了 4 条后降到 5%

🤖 問 AI