腾讯云 Agent Memory 通过上下文卸载与 Mermaid 无限画布的组合方案,在超长 Session 中最高节省 61% Token 并提升 52% 任务通过率,实现了 Agent 短期记忆的高效压缩与结构化管理。
📝 详细摘要
本文由腾讯技术工程团队发布,详细介绍了 TencentDB Agent Memory 产品中短期记忆压缩方案的设计原理与工程实践。核心思路是将 Agent 的长任务执行过程进行分层压缩:通过上下文卸载将完整的工具调用结果保存到外部文件系统,仅保留摘要和索引在上下文中;同时利用 Mermaid 流程图语言将离散的任务步骤组织成带状态、摘要和时间戳的结构化任务画布,使 Agent 能快速理解任务进度和依赖关系。文章从语言学中的压缩原理出发,论证了符号化表示对 LLM 的有效性,并提出了符号设计的三个原则:通用知识、生成简单、表达自由。在载体选型上,通过实验对比发现 Flowchart 比 StateDiagram 更适合 Agent 的探索式执行过程,效果提升约 15%。方案将记忆分为四层:原始原文、工具级 JSONL 摘要、任务级 MMD 画布、任务级 metadata,支持逐级折叠与展开。在 SWEbench、Toolathlon、WideSearch、AA-LCR 四组超长 Session 评测中,该方案均实现了 Token 节省与任务完成率的双重提升。消融实验验证了 MMD 画布的关键作用:仅上下文卸载可节省 15% Token 并提升 5% 成绩,而完整方案可节省 31%-33% Token 并提升约 9.9% 成绩。
💡 主要观点
- 短期记忆压缩的核心是上下文卸载与 Mermaid 无限画布的组合。 上下文卸载解决信息过长问题,将完整工具结果保存到外部文件,仅保留摘要和索引;Mermaid 画布解决结构丢失问题,将离散摘要组织成带状态和依赖关系的任务拓扑图,使 Agent 能快速理解任务进度。
💬 文章金句
- 问题不在于信息太多,而在于信息没有被'压缩成最可用的形式'。
- 真正可用的压缩,不应该依赖模型'记住了什么符号',而应该依赖模型'能够从符号中推理出什么结构'。
- 无限画布的本质可以概括为一句话:'不是让上下文窗口无限变大,而是让上下文之外的信息仍然可见、可定位、可恢复、可继续执行。'
- 上下文卸载就是把 Agent 的工作记忆变轻:眼前只放当前要用的信息,细节放在外部,靠索引随时找回。
- 真正适合长任务的短期记忆压缩,应该同时保留两件事:细节可恢复,结构不丢失。
📊 文章信息
AI 初评:91
来源:腾讯技术工程
作者:腾讯技术工程
分类:人工智能
语言:中文
阅读时间:73 分钟
字数:18084
标签: Agent Memory, 上下文卸载, Mermaid, 短期记忆压缩, Token 优化