本文详细介绍了得物技术团队基于 Claude Code Harness 机制,为离线数仓场景设计的五层防御体系,通过 hooks、subagents 和持久化上下文解决 AI 编码中的 context 丢失、规范执行不稳定和 context 膨胀问题。
📝 详细摘要
本文是得物技术团队的一篇深度实践分享,聚焦于如何利用 Claude Code 的 Harness 工程机制,系统性地解决 AI 辅助数仓开发中的三大核心痛点:AI 在对话中因 context compact 导致的「失忆」问题、SQL 规范执行依赖 LLM 记忆的不稳定性、以及复杂需求开发中 context 迅速膨胀导致 AI 可靠性下降。文章提出了一个五层防御体系:第一层通过 CLAUDE.md 实现项目级上下文持久化;第二层利用 Auto Memory 自动积累跨会话经验;第三层通过 hooks 实现 SQL 规范自动检查和危险 DDL 拦截,将规范遵守率从 70-80% 提升至 95%+;第四层通过 subagents 隔离高 token 消耗操作,预计将 compact 触发频率降低 50-70%;第五层改造 SKILL 文件调用方式,减少主 context 消耗。文章还给出了完整的数仓 Harness 架构设计、8 步 SKILL 工作流改造方案、以及具体的落地步骤和脚本示例。核心思想是将「语义理解」和「规范执行」从不可靠的 LLM 记忆中迁移到确定性的 hooks 和持久化文件中,实现从「对话式辅助」到「规则驱动的自动化流程」的升级。
💡 主要观点
- Claude Code 的 context compact 机制是 AI 编码中「失忆」问题的根源,临时口头约束在压缩后全部丢失。 当对话 token 接近上限时,历史内容被自动压缩为摘要,导致金额单位、字段口径等关键约束被遗忘,这是系统性限制而非偶发问题。
💬 文章金句
- Harness 工程的目标,就是把「执行层」的不稳定因素系统性地消掉:把规范写进 hooks,不再靠 AI 记忆,每次写 SQL 文件后自动触发检查;把迭代约束写进持久化文件,compact 后自动重新注入,不再靠临时口头说;把高 token 操作隔离到 subagent,主 context 只接收摘要,不被过程数据撑满。
- Harness 工程的最终目标,不是让 Claude 更聪明,而是让整个研发流水线更可靠。
- 准确率 = 语义理解深度 × 数据规范覆盖度
- 规范执行是人的短板、AI 的长板;业务判断是 AI 的短板、人的长板。
📊 文章信息
AI 初评:89
来源:得物技术
作者:得物技术
分类:人工智能
语言:中文
阅读时间:38 分钟
字数:9435
标签: Claude Code, Harness, AI 编码, 数仓开发, hooks