神秘模型「大象」：仅 100B 拿下 SOTA，Token 效率超高！

📌 一句话摘要

蚂蚁 Inclusion AI 团队发布 100B 参数模型 Elephant，主打快、准、省，在 AI BENCHY 评测中 Token 效率和响应速度显著优于同类模型。

📝 详细摘要

本文介绍了蚂蚁 Inclusion AI 团队发布的神秘模型 Elephant（大象），该模型仅有 100B 参数，但在同规模模型中达到 SOTA 水平，且 Token 效率极高。文章通过三个实测场景展示了 Elephant 的能力：修 Bug 时能精准定位问题并以极简方式解决，避免冗余 Token 消耗；处理杂乱会议纪要时能严格遵循指令，剔除无用信息并按 JSON 格式输出，相比 Gemini-2.5-Flash-Lite 输出更简洁；在 Agent 任务中，仅用 10 秒思考、2 秒输出即可完成销售数据分析。AI BENCHY 评测显示，Elephant 输出 Token 维持在 2500 左右，平均响应时间约 1 秒，输出一致性达 9.6/10 分。文章也指出了模型的局限性，包括不擅长复杂长链规划、对非常新的知识可能产生幻觉、对模糊 Prompt 敏感。文章认为，Elephant 代表了 AI 行业从追求大模型向追求智效比的转变，与 OpenAI 的 GPT-5.4 mini/nano 和 Google 的 Gemma 4 趋势一致。

💡 主要观点

- 蚂蚁 Inclusion AI 团队发布 100B 参数模型 Elephant，主打快、准、省。 该模型在同规模模型中达到 SOTA，Token 效率极高，平均响应时间约 1 秒，输出一致性达 9.6/10 分。

Elephant 在修 Bug、会议整理、Agent 等高频场景中表现高效。 实测显示，Elephant 能精准定位代码错误并以极简方式修复；处理杂乱会议纪要时能严格按指令输出结构化结果，Token 消耗远低于 Gemini-2.5-Flash-Lite。

Elephant 存在局限性，包括不擅长复杂长链规划和非常新的知识。 对于需要多工具协作的复杂任务，Elephant 无法独立完成；对刚更新的 SDK 或新特性可能产生 API 幻觉，需要注入最新文档辅助。

Elephant 代表了 AI 行业从追求大模型向追求智效比的转变。 与 OpenAI 的 GPT-5.4 mini/nano 和 Google 的 Gemma 4 趋势一致，轻量化、高性价比模型正在成为 AI 从玩具跨越到生产力工具的底座。

💬 文章金句

- 仅 100B 大小，在同规模模型里是 SOTA，还巨省 Token。

Token 浪费，已然成了行业高度重视的关键内容之一。
快、准、省，这三个看似接地气的字眼，正在成为 AI 高效上岗的标准。
做加法的人太多了，需要有人站出来做减法。

📊 文章信息

AI 初评：86

来源：量子位

作者：十三

分类：人工智能

语言：中文

阅读时间：13 分钟

字数：3063

标签： Elephant, 蚂蚁集团, 大语言模型, Token 效率, AI BENCHY

阅读完整文章

神秘模型「大象」：仅 100B 拿下 SOTA，Token 效率超高！

🤖 問 AI