腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍：Mermaid 无限画布×上下文卸载

📌 一句话摘要

腾讯云 Agent Memory 通过上下文卸载与 Mermaid 无限画布的组合方案，在超长 Session 中最高节省 61% Token 并提升 52% 任务通过率，实现了 Agent 短期记忆的高效压缩与结构化管理。

📝 详细摘要

本文由腾讯技术工程团队发布，详细介绍了 TencentDB Agent Memory 产品中短期记忆压缩方案的设计原理与工程实践。核心思路是将 Agent 的长任务执行过程进行分层压缩：通过上下文卸载将完整的工具调用结果保存到外部文件系统，仅保留摘要和索引在上下文中；同时利用 Mermaid 流程图语言将离散的任务步骤组织成带状态、摘要和时间戳的结构化任务画布，使 Agent 能快速理解任务进度和依赖关系。文章从语言学中的压缩原理出发，论证了符号化表示对 LLM 的有效性，并提出了符号设计的三个原则：通用知识、生成简单、表达自由。在载体选型上，通过实验对比发现 Flowchart 比 StateDiagram 更适合 Agent 的探索式执行过程，效果提升约 15%。方案将记忆分为四层：原始原文、工具级 JSONL 摘要、任务级 MMD 画布、任务级 metadata，支持逐级折叠与展开。在 SWEbench、Toolathlon、WideSearch、AA-LCR 四组超长 Session 评测中，该方案均实现了 Token 节省与任务完成率的双重提升。消融实验验证了 MMD 画布的关键作用：仅上下文卸载可节省 15% Token 并提升 5% 成绩，而完整方案可节省 31%-33% Token 并提升约 9.9% 成绩。

💡 主要观点

- 短期记忆压缩的核心是上下文卸载与 Mermaid 无限画布的组合。 上下文卸载解决信息过长问题，将完整工具结果保存到外部文件，仅保留摘要和索引；Mermaid 画布解决结构丢失问题，将离散摘要组织成带状态和依赖关系的任务拓扑图，使 Agent 能快速理解任务进度。

Mermaid Flowchart 比 StateDiagram 更适合 Agent 长任务场景，效果提升约 15%。 Agent 的执行过程是高度自由的探索式过程，包含并行分支、回退和交叉引用。Flowchart 作为万能画布能表达复杂依赖和多路径探索，而 StateDiagram 更适合严格生命周期驱动的场景。

记忆折叠采用四层架构，支持逐级展开与恢复。 从原始原文到工具级 JSONL 摘要、任务级 MMD 画布、再到任务级 metadata，信息逐层变轻。Agent 平时只需查看 MMD 节点，需要细节时通过 node_id 和 result_ref 逐级下钻，避免上下文腐烂。

在四组超长 Session 评测中，方案实现了 Token 节省与任务完成率的双重提升。 WideSearch 节省 61.38% Token 并通过率相对提升 51.52%，SWEbench 节省 33.09% Token 并提升 9.93% 完成率，Toolathlon 通过率从 20% 提升到 35%，AA-LCR 节省 31% Token 并提升 3.5 个百分点准确率。

💬 文章金句

- 问题不在于信息太多，而在于信息没有被'压缩成最可用的形式'。

真正可用的压缩，不应该依赖模型'记住了什么符号'，而应该依赖模型'能够从符号中推理出什么结构'。
无限画布的本质可以概括为一句话：'不是让上下文窗口无限变大，而是让上下文之外的信息仍然可见、可定位、可恢复、可继续执行。'
上下文卸载就是把 Agent 的工作记忆变轻：眼前只放当前要用的信息，细节放在外部，靠索引随时找回。
真正适合长任务的短期记忆压缩，应该同时保留两件事：细节可恢复，结构不丢失。

📊 文章信息

AI 初评：91

来源：腾讯技术工程

作者：腾讯技术工程

分类：人工智能

语言：中文

阅读时间：73 分钟

字数：18084

标签： Agent Memory, 上下文卸载, Mermaid, 短期记忆压缩, Token 优化

阅读完整文章

腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍：Mermaid 无限画布×上下文卸载

🤖 問 AI