大模型的 Agent Skill 功能，在 LLM HTTP 底层交互流中是怎么承载的？

📌 一句话摘要

本文深入剖析了 Cursor 等 AI IDE 中 Agent Skill 功能的底层实现原理，揭示其本质并非协议层概念，而是通过 System Prompt 注入、Tool Calling 机制和多轮交互组合而成的应用层设计模式。

📝 详细摘要

文章以作者自己实现的 mp-read Skill 为例，通过 7 个步骤的详细拆解，完整展示了 Agent Skill 在 OpenAI 兼容协议下的底层交互流程。核心结论是：Skill 在协议层面完全不存在，它被 Cursor 等客户端「编译」成三种协议原语的组合：System/Developer Message 注入指令、Tools Definition 注册工具、Multi-turn Tool Calling 循环执行。文章从 Skill 发现与描述摘要注入开始，逐步演示了 LLM 如何通过 Read 工具加载 SKILL.md 文件、如何按照指令执行前置检查、如何发起核心命令，最终生成响应。作者通过真实的 HTTP 请求/响应 JSON 示例，将抽象的概念具象化，并总结了一张完整的协议映射表，揭示了这种设计模式的精妙之处在于完全复用已有协议，不需要任何扩展。

💡 主要观点

- Agent Skill 不是协议层概念，而是应用层设计模式。 在 OpenAI 兼容协议中不存在 Skill 字段或角色，它被客户端编译为 System Prompt 注入 + Tools 定义 + 多轮 Tool Calling 的组合，完全复用已有协议机制。

Skill 采用渐进式加载策略，先注入摘要再按需加载全文。 Cursor 启动时只将 Skill 的 name 和 description 注入 System Prompt，LLM 判断需要时再通过 Read 工具调用读取完整的 SKILL.md 文件，避免浪费 Token。

Skill 的执行本质是 LLM 自主决策的多轮 Tool Calling 循环。 LLM 读取 SKILL.md 后，按照文档中的步骤通过 Shell、Read 等工具自主执行前置检查、核心命令等操作，整个过程由 LLM 自主驱动。

Skill 的「魔法」在于 System Prompt 措辞和 SKILL.md 编写质量。 这种设计模式的核心是 Prompt Engineering + 文件系统的组合，通过给 LLM 提供「使用手册」让它通过已有工具自己照着做，不需要任何协议扩展。

💬 文章金句

- Skills 是一个纯粹的应用层抽象，它最终被 Cursor（或类似的 AI IDE）'编译'成三种协议原语的组合。

Skill = 动态注入的 system prompt 片段 + 预定义的 tool schema + 多轮 tool calling 循环。
Skill 在协议层面完全不存在。它是一种'给 LLM 写使用手册，让 LLM 通过已有工具自己照着做'的设计模式。
这种设计的精妙之处在于：它完全复用了 OpenAI 协议已有的 tool calling 机制，不需要任何协议扩展。
Skill 的全部'魔法'都发生在 system prompt 的措辞和 SKILL.md 文件的编写质量上——本质上是一种 prompt engineering + 文件系统的组合。

📊 文章信息

AI 初评：89

来源：腾讯云开发者

作者：腾讯云开发者

分类：人工智能

语言：中文

阅读时间：19 分钟

字数：4570

标签： Agent Skill, Tool Calling, Cursor, LLM 协议, AI 编程

阅读完整文章

大模型的 Agent Skill 功能，在 LLM HTTP 底层交互流中是怎么承载的？

🤖 問 AI