蚂蚁百灵团队同步开源两款大模型:万亿参数旗舰 Ling-2.6-1T 面向复杂任务与多步执行,104B 参数高效模型 Ling-2.6-flash 主打极致推理速度与 Agent 场景,两者在智效比和 Token 效率上均表现突出。
📝 详细摘要
本文由魔搭 ModelScope 社区发布,介绍了蚂蚁百灵团队最新开源的两款大模型:Ling-2.6-1T 和 Ling-2.6-flash。Ling-2.6-1T 是一款万亿参数的综合旗舰模型,采用 MLA 与 Linear Attention 的混合架构,在 Artificial Analysis 评测中以极低的 Token 消耗(16M)达到高 Intelligence Index,并在 AIME26、SWE-bench Verified、TAU2-Bench 等多项复杂任务基准上取得开源 SOTA 或第一梯队成绩。Ling-2.6-flash 则是一款总参 104B、激活参数 7.4B 的高效模型,在 4 卡 H20 上推理速度可达 340 tokens/s,Token 消耗仅为同类模型的 1/10,在 Agent 场景(如 BFCL-V4、SWE-bench)中表现突出。文章强调,两款模型并非单纯追求参数规模,而是围绕真实生产环境中的指令遵循、工具调用、多步执行和成本效率进行系统性优化,分别面向复杂工作流和高频 Agent 调用场景。
💡 主要观点
- 蚂蚁百灵开源两款互补模型,分别面向复杂任务和高频 Agent 场景。 Ling-2.6-1T 是万亿参数旗舰,优化多步执行与长上下文;Ling-2.6-flash 是 104B 高效模型,主打低延迟和高 Token 效率,两者形成产品矩阵。
💬 文章金句
- Ling-2.6-1T 追求的不只是「更强」,而是在真实使用中做到更高效、更落地、更智能。
- Ling-2.6-1T 仅用 16M tokens 跑完完整评测,在同类模型中展现出极突出的 Token Efficiency。
- Ling-2.6-flash 以 15M output tokens 实现了 26 分 Intelligence Index,落在「最具吸引力象限」。
- 从 Ling-2.6-1T 到 Ling-2.6-flash,百灵团队这次双料重磅开源的核心思路是一致的:不只是「更强」,而是更高效、更落地、更智能。
📊 文章信息
AI 初评:86
来源:魔搭ModelScope社区
作者:魔搭ModelScope社区
分类:人工智能
语言:中文
阅读时间:11 分钟
字数:2663
标签: 蚂蚁百灵, Ling-2.6-1T, Ling-2.6-flash, 开源模型, 大语言模型