基于 Spring AI 从 0 到 1 构建 AI Agent

📌 一句话摘要

本文是一份基于 Spring AI 框架，从零开始构建一个功能完备的 AI Agent 的详细实践指南，涵盖核心编排、RAG、工具调用、子代理、MCP 协议等核心模块的架构设计与代码实现。

📝 详细摘要

文章详细介绍了作者使用 Spring AI 框架构建一个功能完备的 AI Agent 学习项目的全过程。该项目不仅是一个 Demo，更是一个系统性的工程实践，集成了 Agent 核心编排器、三层压缩的对话记忆管理、可插拔的工具调用机制、包含多路召回与重排的完整 RAG 流水线、基于 Markdown 的 Command/Skill 系统、拥有独立记忆的 SubAgent 以及双向 MCP 协议支持。作者深入剖析了每个模块的设计思路、关键代码实现和工程考量，例如意图识别前置优化 RAG 开销、三层上下文压缩策略、多路召回融合（RRF）等。文章强调 Function Calling 是 Agent 能力的基石，并通过大量代码示例展示了如何将理论转化为可运行的工程实践。

💡 主要观点

- Function Calling 是 AI Agent 能力的核心地基，Skill、SubAgent、RAG 等复杂能力均可封装为 Tool 供 LLM 决策调用。 文章明确指出 LLM 本身不会调用工具，而是由 Agent 服务端执行。通过统一的 InnerTool 接口和 Spring AI 的 ToolCallback 机制，实现了可插拔的工具注册与 ReAct 循环，这是构建复杂 Agent 的工程基础。

采用分层、递进的上下文管理策略是构建实用 Agent 的关键，能有效平衡信息保留与成本控制。 项目设计了智能摘要压缩、Assistant 消息裁剪和滑动窗口三层压缩策略。摘要压缩优先保留语义信息，裁剪精准降低 Token 消耗，滑动窗口提供硬性兜底，三者协同解决了长对话上下文管理的核心难题。

RAG 效果依赖于完整的流水线与混合检索策略，单一方法存在盲区。 文章实践了从文档加载、分块、向量化到检索的完整流程。特别强调了多路召回（语义向量、BM25、查询改写）与 RRF 融合的重要性，并引入 Rerank 进行精排，这是提升检索相关性的有效工程方法。

通过 MCP 协议实现 Agent 与外部服务的标准化连接，是扩展能力边界的重要途径。 项目同时实现了 MCP Server（对外暴露自身 RAG 能力）和 MCP Client（动态连接外部服务）。这种双向支持使得 Agent 既能被集成，也能集成他人，体现了开放和模块化的设计思想。

💬 文章金句

- LLM 本身是不会去调用各种服务，Agent 服务端只是告诉大模型‘有哪些工具可以调用’，LLM 返回给 Agent 服务端的是‘要去调哪些工具’，真实调用是在 Agent 服务端。

意图识别前置的好处是：避免每次对话都触发 RAG 检索，节省不必要的向量检索和 Rerank 开销。
三层策略协同工作：摘要压缩优先触发（保留信息），Assistant 裁剪持续生效（精准省 token），滑动窗口兜底（硬性保护）。
RRF 只看排名不看绝对分数，天然适合融合不同算法的结果。
Command 是‘用户告诉 Agent 做什么’，Skill 是‘Agent 自己判断该做什么’。
目前而言 Function Calling 是 Harness 的大地基，实际上很多能力的实现都是基于 Function Calling。

📊 文章信息

AI 初评：91

来源：阿里云开发者

作者：阿里云开发者

分类：人工智能

语言：中文

阅读时间：28 分钟

字数：6799

标签： Spring AI, AI Agent, RAG, Function Calling, MCP

阅读完整文章

基于 Spring AI 从 0 到 1 构建 AI Agent

🤖 問 AI