Cursor 发布 Composer 2.5 模型,基于 Kimi K2.5,通过定向文本反馈强化学习、合成数据(25 倍于前代)和 Muon 优化器等技术,显著提升了长任务处理、指令遵循和协作交互能力。
📝 详细摘要
该推文解读了 Cursor 发布的 Composer 2.5 模型。该模型仍基于 Kimi K2.5,但通过三项关键训练创新实现了显著提升:1)定向文本反馈强化学习,解决了长任务中的信用分配难题;2)合成训练数据量是 Composer 2 的 25 倍,其中 feature deletion 方法让 Agent 在缺失特性的代码库中重新实现特性;3)基础设施层使用 Muon 优化器和分布式正交化,1T 模型优化器单步仅需 0.2 秒。此外,模型还专门优化了沟通风格和投入度校准等 benchmark 难以衡量的「软」维度。推文还提到 Cursor 与 SpaceXAI 合作,马斯克证实 Composer 2.5 已使用 Colossus 2 算力训练,并计划训练算力规模 10 倍以上的新模型。
📊 文章信息
AI 初评:86
来源:meng shao(@shao__meng)
作者:meng shao
分类:人工智能
语言:中文
阅读时间:4 分钟
字数:801
标签: Cursor, Composer 2.5, Kimi K2.5, AI Coding, Reinforcement Learning