← 回總覽

Cursor 自研模型反超 Opus 4.6!价格脚踝斩,氛围编程沸腾了

📅 2026-03-20 12:09 一水 人工智能 2 分鐘 1429 字 評分: 82
Cursor Composer 2 AI 编程 强化学习 上下文压缩
📌 一句话摘要 Cursor 发布自研编程模型 Composer 2,凭借创新的“自我总结”强化学习技术,在性能超越 Claude Opus 4.6 的同时实现了价格的“脚踝斩”。 📝 详细摘要 本文详细报道了 AI 编程工具 Cursor 推出的自研模型 Composer 2 及其高性能变体。该模型在 Terminal-Bench 2.0 等多项基准测试中超越了行业标杆 Claude Opus 4.6,且使用成本大幅降低。核心技术突破在于引入了一种名为“自我总结(Self-summary)”的强化学习方法,使模型在处理长链条复杂任务时,能主动进行阶段性总结并压缩上下文。相比于传统的摘要或

📌 一句话摘要

Cursor 发布自研编程模型 Composer 2,凭借创新的“自我总结”强化学习技术,在性能超越 Claude Opus 4.6 的同时实现了价格的“脚踝斩”。

📝 详细摘要

本文详细报道了 AI 编程工具 Cursor 推出的自研模型 Composer 2 及其高性能变体。该模型在 Terminal-Bench 2.0 等多项基准测试中超越了行业标杆 Claude Opus 4.6,且使用成本大幅降低。核心技术突破在于引入了一种名为“自我总结(Self-summary)”的强化学习方法,使模型在处理长链条复杂任务时,能主动进行阶段性总结并压缩上下文。相比于传统的摘要或滑动窗口方案,该方法将 Token 用量降至五分之一,同时错误率减少了 50%,显著提升了模型在超长任务(如在 MIPS 架构上运行 Doom)中的逻辑连贯性和执行成功率。此举标志着 Cursor 从单纯的应用开发商向具备核心模型研发能力的综合性 AI 公司转型。

💡 主要观点

- Cursor 推出自研模型 Composer 2,在性能超越顶级模型的同时实现了极低定价。 通过自研模型打破了对外部供应商的依赖,在 Terminal-Bench 2.0 等测试中表现优异,且输入输出价格仅为 Claude Opus 4.6 的一小部分。

核心技术“自我总结(Self-summary)”通过强化学习将总结能力内化为模型本能。 模型在处理长任务时会主动停下来进行阶段性笔记,这种能力是在训练循环中通过奖励机制习得的,而非简单的提示词工程,有效解决了长上下文遗忘问题。
新型压缩机制显著提升了长链条复杂工程任务的处理效率和准确性。 相比传统摘要法,新机制将 Token 用量压缩至 1/5,错误率降低 50%,使模型能支撑超过 170 轮的复杂交互,完成如跨架构运行游戏等高难度任务。
Cursor 正在从单一的应用层产品向具备底层模型研发能力的综合体演进。 CEO 表示 Cursor 既非纯粹的应用商也非纯模型商,这种垂直整合模式使其能针对编程场景进行深度优化,快速迭代出如 Composer 3 等后续产品。

💬 文章金句

- 其最新编程模型 Composer 2,不仅能力超越 Claude Opus 4.6,关键是价格降了非常多。

  • 让模型学会‘自己给自己做会议纪要’,从而把原本记不住的超长任务,一步步接着干下去。
  • 这种名为‘自我总结的强化学习方法’听起来有点拗口,但思路其实很清晰。
  • 压缩得更狠,但信息更关键。
  • Cursor 是一个典型的新公司,既不是纯粹的应用程序开发商,也不是模型提供商。

📊 文章信息

AI 评分:82

来源:量子位

作者:一水

分类:人工智能

语言:中文

阅读时间:11 分钟

字数:2577

标签: Cursor, Composer 2, AI 编程, 强化学习, 上下文压缩

阅读完整文章

查看原文 → 發佈: 2026-03-20 12:09:59 收錄: 2026-03-20 14:00:51

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。