Claude Code Harness 工程：数仓侧落地方案｜得物技术

📌 一句话摘要

本文详细介绍了得物技术团队基于 Claude Code Harness 机制，为离线数仓场景设计的五层防御体系，通过 hooks、subagents 和持久化上下文解决 AI 编码中的 context 丢失、规范执行不稳定和 context 膨胀问题。

📝 详细摘要

本文是得物技术团队的一篇深度实践分享，聚焦于如何利用 Claude Code 的 Harness 工程机制，系统性地解决 AI 辅助数仓开发中的三大核心痛点：AI 在对话中因 context compact 导致的「失忆」问题、SQL 规范执行依赖 LLM 记忆的不稳定性、以及复杂需求开发中 context 迅速膨胀导致 AI 可靠性下降。文章提出了一个五层防御体系：第一层通过 CLAUDE.md 实现项目级上下文持久化；第二层利用 Auto Memory 自动积累跨会话经验；第三层通过 hooks 实现 SQL 规范自动检查和危险 DDL 拦截，将规范遵守率从 70-80% 提升至 95%+；第四层通过 subagents 隔离高 token 消耗操作，预计将 compact 触发频率降低 50-70%；第五层改造 SKILL 文件调用方式，减少主 context 消耗。文章还给出了完整的数仓 Harness 架构设计、8 步 SKILL 工作流改造方案、以及具体的落地步骤和脚本示例。核心思想是将「语义理解」和「规范执行」从不可靠的 LLM 记忆中迁移到确定性的 hooks 和持久化文件中，实现从「对话式辅助」到「规则驱动的自动化流程」的升级。

💡 主要观点

- Claude Code 的 context compact 机制是 AI 编码中「失忆」问题的根源，临时口头约束在压缩后全部丢失。 当对话 token 接近上限时，历史内容被自动压缩为摘要，导致金额单位、字段口径等关键约束被遗忘，这是系统性限制而非偶发问题。

通过 Harness 的 hooks 机制，可以将 SQL 规范检查从「LLM 记忆」迁移到「确定性执行」，规范遵守率从 70-80% 提升至 95%+。 PostToolUse hook 在每次写入 .sql 文件后自动触发规范检查，违规时 exit 2 强制阻断，不依赖 AI 是否记住了规范要求，实现了从「指导性内容」到「强制检查护栏」的转变。

subagents 通过独立 context 隔离高 token 操作，可降低主 context compact 触发频率 50-70%。 血缘查询、自测结果、数据比对等操作会产生大量 token，放到 subagent 的独立 context 中执行，主会话只接收结构化摘要，有效防止 context 被过程数据撑满。

数仓 AI 开发的本质瓶颈是语义理解而非技术能力，Harness 工程将语义和规范从不可靠的 LLM 记忆迁移到确定性机制。 需求理解偏差占总返工的 40-60%，AI 的不准确根源在于不理解业务语义（如金额单位、字段口径），而非不会写 SQL。Harness 通过持久化上下文和确定性检查来解决这一问题。

💬 文章金句

- Harness 工程的目标，就是把「执行层」的不稳定因素系统性地消掉：把规范写进 hooks，不再靠 AI 记忆，每次写 SQL 文件后自动触发检查；把迭代约束写进持久化文件，compact 后自动重新注入，不再靠临时口头说；把高 token 操作隔离到 subagent，主 context 只接收摘要，不被过程数据撑满。

Harness 工程的最终目标，不是让 Claude 更聪明，而是让整个研发流水线更可靠。
准确率 = 语义理解深度 × 数据规范覆盖度
规范执行是人的短板、AI 的长板；业务判断是 AI 的短板、人的长板。

📊 文章信息

AI 初评：89

来源：得物技术

作者：得物技术

分类：人工智能

语言：中文

阅读时间：38 分钟

字数：9435

标签： Claude Code, Harness, AI 编码, 数仓开发, hooks

阅读完整文章

Claude Code Harness 工程：数仓侧落地方案｜得物技术

🤖 問 AI