Cursor 自研模型反超 Opus 4.6！价格脚踝斩，氛围编程沸腾了

📌 一句话摘要

Cursor 发布自研编程模型 Composer 2，凭借创新的“自我总结”强化学习技术，在性能超越 Claude Opus 4.6 的同时实现了价格的“脚踝斩”。

📝 详细摘要

本文详细报道了 AI 编程工具 Cursor 推出的自研模型 Composer 2 及其高性能变体。该模型在 Terminal-Bench 2.0 等多项基准测试中超越了行业标杆 Claude Opus 4.6，且使用成本大幅降低。核心技术突破在于引入了一种名为“自我总结（Self-summary）”的强化学习方法，使模型在处理长链条复杂任务时，能主动进行阶段性总结并压缩上下文。相比于传统的摘要或滑动窗口方案，该方法将 Token 用量降至五分之一，同时错误率减少了 50%，显著提升了模型在超长任务（如在 MIPS 架构上运行 Doom）中的逻辑连贯性和执行成功率。此举标志着 Cursor 从单纯的应用开发商向具备核心模型研发能力的综合性 AI 公司转型。

💡 主要观点

- Cursor 推出自研模型 Composer 2，在性能超越顶级模型的同时实现了极低定价。 通过自研模型打破了对外部供应商的依赖，在 Terminal-Bench 2.0 等测试中表现优异，且输入输出价格仅为 Claude Opus 4.6 的一小部分。

核心技术“自我总结（Self-summary）”通过强化学习将总结能力内化为模型本能。 模型在处理长任务时会主动停下来进行阶段性笔记，这种能力是在训练循环中通过奖励机制习得的，而非简单的提示词工程，有效解决了长上下文遗忘问题。

新型压缩机制显著提升了长链条复杂工程任务的处理效率和准确性。 相比传统摘要法，新机制将 Token 用量压缩至 1/5，错误率降低 50%，使模型能支撑超过 170 轮的复杂交互，完成如跨架构运行游戏等高难度任务。

Cursor 正在从单一的应用层产品向具备底层模型研发能力的综合体演进。 CEO 表示 Cursor 既非纯粹的应用商也非纯模型商，这种垂直整合模式使其能针对编程场景进行深度优化，快速迭代出如 Composer 3 等后续产品。

💬 文章金句

- 其最新编程模型 Composer 2，不仅能力超越 Claude Opus 4.6，关键是价格降了非常多。

让模型学会‘自己给自己做会议纪要’，从而把原本记不住的超长任务，一步步接着干下去。
这种名为‘自我总结的强化学习方法’听起来有点拗口，但思路其实很清晰。
压缩得更狠，但信息更关键。
Cursor 是一个典型的新公司，既不是纯粹的应用程序开发商，也不是模型提供商。

📊 文章信息

AI 评分：82

来源：量子位

作者：一水

分类：人工智能

语言：中文

阅读时间：11 分钟

字数：2577

标签： Cursor, Composer 2, AI 编程, 强化学习, 上下文压缩

阅读完整文章

Cursor 自研模型反超 Opus 4.6！价格脚踝斩，氛围编程沸腾了

🤖 問 AI