← 回總覽

SQL 规范执行率提至 95%,得物数仓 Harness 实践全解析

📅 2026-06-04 07:15 dbaplus社群 人工智能 2 分鐘 1723 字 評分: 89
AI 编程 LLM AI Agent 提示工程 开发者工具
📌 一句话摘要 本文详细介绍了得物数仓团队如何通过 Claude Code 的 Harness 机制(hooks + subagents + 持久化文件),将 SQL 规范执行率从 70-80% 提升至 95% 以上,并系统性解决 AI 编码中 context 丢失与规范执行不稳定的问题。 📝 详细摘要 文章以得物离线数仓团队使用 AI Coding 工具(Claude Code)的实践为背景,深入剖析了 AI 辅助开发中的三大核心痛点:AI 因 context compact 机制导致的「失忆」、规范执行不稳定、以及大型需求开发中 context 快速耗尽。针对这些问题,作者提出了一套基

📌 一句话摘要

本文详细介绍了得物数仓团队如何通过 Claude Code 的 Harness 机制(hooks + subagents + 持久化文件),将 SQL 规范执行率从 70-80% 提升至 95% 以上,并系统性解决 AI 编码中 context 丢失与规范执行不稳定的问题。

📝 详细摘要

文章以得物离线数仓团队使用 AI Coding 工具(Claude Code)的实践为背景,深入剖析了 AI 辅助开发中的三大核心痛点:AI 因 context compact 机制导致的「失忆」、规范执行不稳定、以及大型需求开发中 context 快速耗尽。针对这些问题,作者提出了一套基于 Claude Code Harness 机制的五层防御体系:写死进 CLAUDE.md 实现持久化、利用 Auto Memory 自动积累、通过 hooks 实现 SQL 规范自动检查与危险 DDL 拦截、使用 subagents 隔离高 token 消耗操作、以及改造 SKILL 文件调用方式。文章详细给出了每一层的配置代码、脚本示例和工作流设计,并提供了完整的落地步骤。最终,作者将这套方案总结为从「AI 帮我写代码」到「AI 嵌入研发流水线」的升级,核心是将语义和规范从不可靠的 LLM 记忆中迁移到确定性的 hooks 和持久化文件中。

💡 主要观点

- AI 编码的核心瓶颈在于 context 丢失与规范执行不稳定,而非技术能力。 文章指出,Claude Code 的 context compact 机制会导致临时约束(如字段单位)丢失,而 LLM 对规范的记忆遵守率仅 70-80%,这是导致 AI 生成代码质量不稳定的根本原因。

Harness 机制通过 hooks 实现确定性规范检查,将规范执行率提升至 95%+。 通过在 Claude Code 的 settings.json 中配置 PostToolUse hook,每次写入 .sql 文件后自动触发 validate_sql.sh 脚本,对 SELECT *、缺少 PARTITION 等违规项进行阻断,不依赖 LLM 记忆。
Subagents 通过上下文隔离,可降低主 context compact 频率 50-70%。 将血缘查询、自测执行等高 token 消耗操作下放到独立 context 的 subagent 中执行,主会话只接收结构化摘要,有效防止 context 被撑满。
Harness 工程的本质是将「语义」和「规范」从 LLM 记忆迁移到确定性文件与 hooks 中。 通过 CLAUDE.md 持久化字段口径与迭代约束,通过 hooks 强制执行规范检查,使「准确率 = 语义理解深度 × 数据规范覆盖度」等式中的两个变量变得稳定可靠。

💬 文章金句

- 规范执行是人的短板、AI 的长板;业务判断是 AI 的短板、人的长板。

  • Harness 工程的最终目标,不是让 Claude 更聪明,而是让整个研发流水线更可靠。
  • 把规范从「LLM 记忆中的指导性内容」变成「每次执行时强制检查的护栏」。

📊 文章信息

AI 初评:89

来源:dbaplus社群

作者:dbaplus社群

分类:人工智能

语言:中文

阅读时间:36 分钟

字数:8920

标签: AI 编程, LLM, AI Agent, 提示工程, 开发者工具

阅读完整文章

查看原文 → 發佈: 2026-06-04 07:15:00 收錄: 2026-06-04 12:00:35

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。