一篇基于斯坦福、MIT 等高校联合论文的深度分析,系统揭示了 AI Agent 在代码任务中 Token 消耗的不可预测性、成本失控的根源,以及模型效率的显著差异。
📝 详细摘要
本文基于一篇 2026 年 4 月发表的预印本论文,深入剖析了 AI Agent 在自主编码任务中的 Token 消耗问题。文章指出,Agent 的 Token 消耗量是普通 AI 对话的约 1000 倍,成本主要花在「读代码」而非「写代码」上。研究发现,同一任务多次运行的成本波动可达 2 倍,跨模型差异高达 30 倍,且高成本并不等同于高成功率,反而可能因 Agent 陷入重复劳动而降低效率。文章还揭示了模型之间「能效比」的巨大差异,以及模型自身无法准确预测 Token 消耗的困境。最后,文章讨论了这些发现对 Agent 定价模式、模型选型和 Agent 设计(如引入预算感知策略)的深远影响。
💡 主要观点
- AI Agent 编码任务的 Token 消耗是普通对话的约 1000 倍。 成本主要源于 Agent 在探索和调试过程中需要反复读取大量项目上下文,导致输入 Token 指数级增长,而非输出代码本身。
💬 文章金句
- 驱动 Agent 成本的,是输入 Token 的指数级增长,而非输出 Token。
- 花得多,不代表做得好。
- 有些模型天生就「话多」,跟任务难度关系不大。
- 现阶段,前沿模型无法准确预测自身的 Token 用量。点下「运行 Agent」,就像开盲盒------账单出来才知道花了多少。
📊 文章信息
AI 初评:86
来源:钛媒体
作者:钛媒体
分类:人工智能
语言:中文
阅读时间:14 分钟
字数:3447
标签: AI Agent, Token 消耗, 成本分析, 编码效率, 模型选型