超越 RAG：用 Spring Boot 构建具备上下文感知能力的 AI 系统

📌 一句话摘要

本文提出上下文增强生成（CAG）架构模式，通过在现有 RAG 流程之上引入显式的上下文管理器，解决企业级 AI 应用中运行时上下文缺失的问题，并给出基于 Spring Boot 的实现方案。

📝 详细摘要

文章首先指出传统 RAG 架构在企业级应用中的核心局限：虽然能提升事实准确性，但无法建模运行时上下文，如用户身份、会话状态和业务约束。针对这一问题，作者提出了上下文增强生成（CAG）架构模式，即在现有 RAG 流程之上增加一个独立的上下文管理器层，负责收集和规范化用户、会话、策略等运行时信号，再传递给下游的检索和生成组件。文章以 Spring Boot 为例，展示了如何通过引入 ContextManager 接口和 Context 对象，在不改变既有 RAG 组件的前提下实现 CAG。同时，文章还讨论了生产落地的关键实践，包括控制上下文范围、保持可观测性、设计降级策略、避免上下文管理器过载等。CAG 的核心价值在于将上下文提升为一等架构要素，使 AI 系统从以文档为中心的助手演进为具备上下文感知能力的企业级服务。

💡 主要观点

- 传统 RAG 无法建模运行时上下文，是企业级 AI 应用的核心架构缺口。 RAG 擅长解决找什么信息的问题，但无法处理用户身份、会话历史、流程状态和业务约束等运行时上下文，导致回答在事实层面正确但在上下文上不合适。

CAG 通过在 RAG 流程之上引入显式的上下文管理器来弥补这一缺口。 上下文管理器作为独立组件，负责收集用户属性、会话历史和策略约束，生成统一的上下文对象，在检索和生成阶段一致使用，而不改变底层 RAG 组件。

CAG 在 Spring Boot 中可通过轻量级架构扩展实现，无需重构现有系统。 通过引入 ContextManager 接口和 Context 对象，在控制器层编排上下文组装逻辑，现有检索器和 LLM 服务保持不变，实现渐进式演进。

生产落地 CAG 需要关注上下文范围控制、可观测性和降级设计。 上下文并非越多越好，应优先保留关键信息；需要记录上下文使用情况以支持审计和排查；同时应设计降级策略应对数据不完整的情况。

💬 文章金句

- RAG 擅长解决'找什么信息'的问题，但并不负责建模企业系统运行所需的上下文。

CAG 的价值在于将这些做法规范化，使'上下文组装'成为系统中一个明确且可复用的能力。
RAG 关注'哪些信息相关'，而 CAG 关注'这些信息对谁相关、在什么情境下相关，以及受到哪些约束'。
通过将'上下文'提升为一等架构要素，基于 Spring Boot 的系统可以在不大规模改造的前提下，从以文档为中心的 AI 助手演进为具备上下文感知能力的企业服务。

📊 文章信息

AI 初评：86

来源：InfoQ 中文

作者：InfoQ 中文

分类：人工智能

语言：中文

阅读时间：26 分钟

字数：6374

标签： CAG, RAG, Spring Boot, 上下文感知, 企业级 AI

阅读完整文章

超越 RAG：用 Spring Boot 构建具备上下文感知能力的 AI 系统

🤖 問 AI