SQL 规范执行率提至 95%，得物数仓 Harness 实践全解析

📌 一句话摘要

本文详细介绍了得物数仓团队如何通过 Claude Code 的 Harness 机制（hooks + subagents + 持久化文件），将 SQL 规范执行率从 70-80% 提升至 95% 以上，并系统性解决 AI 编码中 context 丢失与规范执行不稳定的问题。

📝 详细摘要

文章以得物离线数仓团队使用 AI Coding 工具（Claude Code）的实践为背景，深入剖析了 AI 辅助开发中的三大核心痛点：AI 因 context compact 机制导致的「失忆」、规范执行不稳定、以及大型需求开发中 context 快速耗尽。针对这些问题，作者提出了一套基于 Claude Code Harness 机制的五层防御体系：写死进 CLAUDE.md 实现持久化、利用 Auto Memory 自动积累、通过 hooks 实现 SQL 规范自动检查与危险 DDL 拦截、使用 subagents 隔离高 token 消耗操作、以及改造 SKILL 文件调用方式。文章详细给出了每一层的配置代码、脚本示例和工作流设计，并提供了完整的落地步骤。最终，作者将这套方案总结为从「AI 帮我写代码」到「AI 嵌入研发流水线」的升级，核心是将语义和规范从不可靠的 LLM 记忆中迁移到确定性的 hooks 和持久化文件中。

💡 主要观点

- AI 编码的核心瓶颈在于 context 丢失与规范执行不稳定，而非技术能力。 文章指出，Claude Code 的 context compact 机制会导致临时约束（如字段单位）丢失，而 LLM 对规范的记忆遵守率仅 70-80%，这是导致 AI 生成代码质量不稳定的根本原因。

Harness 机制通过 hooks 实现确定性规范检查，将规范执行率提升至 95%+。 通过在 Claude Code 的 settings.json 中配置 PostToolUse hook，每次写入 .sql 文件后自动触发 validate_sql.sh 脚本，对 SELECT *、缺少 PARTITION 等违规项进行阻断，不依赖 LLM 记忆。

Subagents 通过上下文隔离，可降低主 context compact 频率 50-70%。 将血缘查询、自测执行等高 token 消耗操作下放到独立 context 的 subagent 中执行，主会话只接收结构化摘要，有效防止 context 被撑满。

Harness 工程的本质是将「语义」和「规范」从 LLM 记忆迁移到确定性文件与 hooks 中。 通过 CLAUDE.md 持久化字段口径与迭代约束，通过 hooks 强制执行规范检查，使「准确率 = 语义理解深度 × 数据规范覆盖度」等式中的两个变量变得稳定可靠。

💬 文章金句

- 规范执行是人的短板、AI 的长板；业务判断是 AI 的短板、人的长板。

Harness 工程的最终目标，不是让 Claude 更聪明，而是让整个研发流水线更可靠。
把规范从「LLM 记忆中的指导性内容」变成「每次执行时强制检查的护栏」。

📊 文章信息

AI 初评：89

来源：dbaplus社群

作者：dbaplus社群

分类：人工智能

语言：中文

阅读时间：36 分钟

字数：8920

标签： AI 编程, LLM, AI Agent, 提示工程, 开发者工具

阅读完整文章

SQL 规范执行率提至 95%，得物数仓 Harness 实践全解析

🤖 問 AI