腾讯技术工程团队提出通过上下文卸载和 Mermaid 任务画布的组合方案,解决 Agent 在长任务中因上下文信息冗余导致的性能下降问题,最高节省 61% Token 并提升任务通过率。
📝 详细摘要
这是一篇对腾讯技术工程团队文章的深度解读 Thread。文章核心问题是 Agent 在长任务执行过程中,不断产生的中间信息(网页正文、搜索结果、日志、代码片段等)会堆满上下文,导致 Token 成本上升、Agent 被旧信息干扰、忘记目标或混淆子任务。作者提出的解决方案是「短期记忆压缩 = 上下文卸载 + Mermaid 任务画布」。上下文卸载将完整工具结果保存到外部文件系统,上下文只保留摘要和索引;Mermaid 任务画布将离散的任务步骤组织成带状态、摘要和时间戳的结构化任务地图,使 Agent 能快速理解任务进度和依赖关系。方案采用四层分层记忆架构:原始原文、工具级 JSONL 摘要、任务级 MMD 画布、任务级 metadata。实验结果显示,在网页搜索任务中最高节省约 61% Token,代码修复任务中节省约 31%-33% Token,复杂长任务通过率从 20% 提升到 30%-35%。消融实验证明 Mermaid 画布是关键组件。
📊 文章信息
AI 初评:85
来源:ginobefun(@hongming731)
作者:ginobefun
分类:人工智能
语言:中文
阅读时间:7 分钟
字数:1609
标签: Agent Memory, 上下文卸载, Mermaid, Token 优化, 长任务