← 回總覽

腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍:Mermaid 无限画布×上下文卸载

📅 2026-05-22 17:36 腾讯技术工程 人工智能 2 分鐘 2004 字 評分: 91
Agent Memory 上下文卸载 Mermaid 短期记忆压缩 Token 优化
📌 一句话摘要 腾讯云 Agent Memory 通过上下文卸载与 Mermaid 无限画布的组合方案,在超长 Session 中最高节省 61% Token 并提升 52% 任务通过率,实现了 Agent 短期记忆的高效压缩与结构化管理。 📝 详细摘要 本文由腾讯技术工程团队发布,详细介绍了 TencentDB Agent Memory 产品中短期记忆压缩方案的设计原理与工程实践。核心思路是将 Agent 的长任务执行过程进行分层压缩:通过上下文卸载将完整的工具调用结果保存到外部文件系统,仅保留摘要和索引在上下文中;同时利用 Mermaid 流程图语言将离散的任务步骤组织成带状态、摘要和

📌 一句话摘要

腾讯云 Agent Memory 通过上下文卸载与 Mermaid 无限画布的组合方案,在超长 Session 中最高节省 61% Token 并提升 52% 任务通过率,实现了 Agent 短期记忆的高效压缩与结构化管理。

📝 详细摘要

本文由腾讯技术工程团队发布,详细介绍了 TencentDB Agent Memory 产品中短期记忆压缩方案的设计原理与工程实践。核心思路是将 Agent 的长任务执行过程进行分层压缩:通过上下文卸载将完整的工具调用结果保存到外部文件系统,仅保留摘要和索引在上下文中;同时利用 Mermaid 流程图语言将离散的任务步骤组织成带状态、摘要和时间戳的结构化任务画布,使 Agent 能快速理解任务进度和依赖关系。文章从语言学中的压缩原理出发,论证了符号化表示对 LLM 的有效性,并提出了符号设计的三个原则:通用知识、生成简单、表达自由。在载体选型上,通过实验对比发现 Flowchart 比 StateDiagram 更适合 Agent 的探索式执行过程,效果提升约 15%。方案将记忆分为四层:原始原文、工具级 JSONL 摘要、任务级 MMD 画布、任务级 metadata,支持逐级折叠与展开。在 SWEbench、Toolathlon、WideSearch、AA-LCR 四组超长 Session 评测中,该方案均实现了 Token 节省与任务完成率的双重提升。消融实验验证了 MMD 画布的关键作用:仅上下文卸载可节省 15% Token 并提升 5% 成绩,而完整方案可节省 31%-33% Token 并提升约 9.9% 成绩。

💡 主要观点

- 短期记忆压缩的核心是上下文卸载与 Mermaid 无限画布的组合。 上下文卸载解决信息过长问题,将完整工具结果保存到外部文件,仅保留摘要和索引;Mermaid 画布解决结构丢失问题,将离散摘要组织成带状态和依赖关系的任务拓扑图,使 Agent 能快速理解任务进度。

Mermaid Flowchart 比 StateDiagram 更适合 Agent 长任务场景,效果提升约 15%。 Agent 的执行过程是高度自由的探索式过程,包含并行分支、回退和交叉引用。Flowchart 作为万能画布能表达复杂依赖和多路径探索,而 StateDiagram 更适合严格生命周期驱动的场景。
记忆折叠采用四层架构,支持逐级展开与恢复。 从原始原文到工具级 JSONL 摘要、任务级 MMD 画布、再到任务级 metadata,信息逐层变轻。Agent 平时只需查看 MMD 节点,需要细节时通过 node_id 和 result_ref 逐级下钻,避免上下文腐烂。
在四组超长 Session 评测中,方案实现了 Token 节省与任务完成率的双重提升。 WideSearch 节省 61.38% Token 并通过率相对提升 51.52%,SWEbench 节省 33.09% Token 并提升 9.93% 完成率,Toolathlon 通过率从 20% 提升到 35%,AA-LCR 节省 31% Token 并提升 3.5 个百分点准确率。

💬 文章金句

- 问题不在于信息太多,而在于信息没有被'压缩成最可用的形式'。

  • 真正可用的压缩,不应该依赖模型'记住了什么符号',而应该依赖模型'能够从符号中推理出什么结构'。
  • 无限画布的本质可以概括为一句话:'不是让上下文窗口无限变大,而是让上下文之外的信息仍然可见、可定位、可恢复、可继续执行。'
  • 上下文卸载就是把 Agent 的工作记忆变轻:眼前只放当前要用的信息,细节放在外部,靠索引随时找回。
  • 真正适合长任务的短期记忆压缩,应该同时保留两件事:细节可恢复,结构不丢失。

📊 文章信息

AI 初评:91

来源:腾讯技术工程

作者:腾讯技术工程

分类:人工智能

语言:中文

阅读时间:73 分钟

字数:18084

标签: Agent Memory, 上下文卸载, Mermaid, 短期记忆压缩, Token 优化

阅读完整文章

查看原文 → 發佈: 2026-05-22 17:36:00 收錄: 2026-05-22 22:00:45

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。