蚂蚁百灵双响开源：万亿旗舰 Ling-2.6-1T 与高效 Agent 主力 Ling-2.6-flash

📌 一句话摘要

蚂蚁百灵团队同步开源两款大模型：万亿参数旗舰 Ling-2.6-1T 面向复杂任务与多步执行，104B 参数高效模型 Ling-2.6-flash 主打极致推理速度与 Agent 场景，两者在智效比和 Token 效率上均表现突出。

📝 详细摘要

本文由魔搭 ModelScope 社区发布，介绍了蚂蚁百灵团队最新开源的两款大模型：Ling-2.6-1T 和 Ling-2.6-flash。Ling-2.6-1T 是一款万亿参数的综合旗舰模型，采用 MLA 与 Linear Attention 的混合架构，在 Artificial Analysis 评测中以极低的 Token 消耗（16M）达到高 Intelligence Index，并在 AIME26、SWE-bench Verified、TAU2-Bench 等多项复杂任务基准上取得开源 SOTA 或第一梯队成绩。Ling-2.6-flash 则是一款总参 104B、激活参数 7.4B 的高效模型，在 4 卡 H20 上推理速度可达 340 tokens/s，Token 消耗仅为同类模型的 1/10，在 Agent 场景（如 BFCL-V4、SWE-bench）中表现突出。文章强调，两款模型并非单纯追求参数规模，而是围绕真实生产环境中的指令遵循、工具调用、多步执行和成本效率进行系统性优化，分别面向复杂工作流和高频 Agent 调用场景。

💡 主要观点

- 蚂蚁百灵开源两款互补模型，分别面向复杂任务和高频 Agent 场景。 Ling-2.6-1T 是万亿参数旗舰，优化多步执行与长上下文；Ling-2.6-flash 是 104B 高效模型，主打低延迟和高 Token 效率，两者形成产品矩阵。

Ling-2.6-1T 在多项复杂任务基准上取得开源 SOTA。 在 AIME26、SWE-bench Verified、TAU2-Bench 等推理、代码和 Agent 执行基准上，该模型显著领先 GPT-5.4、DeepSeek-V3.2 等非思考模型，展现均衡的综合能力。

Ling-2.6-flash 以极低 Token 消耗实现高智效比。 该模型在 Artificial Analysis 评测中仅消耗 15M tokens，约为 Nemotron-3-Super 等模型的 1/10，但 Intelligence Index 达到 26 分，输出速度达 215 tokens/s。

两款模型均强调真实生产环境中的落地能力。 文章指出，模型竞争已从参数规模和榜单分数转向指令遵循、工具调用、多步执行和成本效率，两款模型正是为此进行系统性优化。

💬 文章金句

- Ling-2.6-1T 追求的不只是「更强」，而是在真实使用中做到更高效、更落地、更智能。

Ling-2.6-1T 仅用 16M tokens 跑完完整评测，在同类模型中展现出极突出的 Token Efficiency。
Ling-2.6-flash 以 15M output tokens 实现了 26 分 Intelligence Index，落在「最具吸引力象限」。
从 Ling-2.6-1T 到 Ling-2.6-flash，百灵团队这次双料重磅开源的核心思路是一致的：不只是「更强」，而是更高效、更落地、更智能。

📊 文章信息

AI 初评：86

来源：魔搭ModelScope社区

作者：魔搭ModelScope社区

分类：人工智能

语言：中文

阅读时间：11 分钟

字数：2663

标签：蚂蚁百灵, Ling-2.6-1T, Ling-2.6-flash, 开源模型, 大语言模型

阅读完整文章

蚂蚁百灵双响开源：万亿旗舰 Ling-2.6-1T 与 高效 Agent 主力 Ling-2.6-flash

🤖 問 AI

蚂蚁百灵双响开源：万亿旗舰 Ling-2.6-1T 与高效 Agent 主力 Ling-2.6-flash