← 回總覽

神秘模型「大象」:仅 100B 拿下 SOTA,Token 效率超高!

📅 2026-04-22 18:29 十三 人工智能 2 分鐘 1510 字 評分: 86
Elephant 蚂蚁集团 大语言模型 Token 效率 AI BENCHY
📌 一句话摘要 蚂蚁 Inclusion AI 团队发布 100B 参数模型 Elephant,主打快、准、省,在 AI BENCHY 评测中 Token 效率和响应速度显著优于同类模型。 📝 详细摘要 本文介绍了蚂蚁 Inclusion AI 团队发布的神秘模型 Elephant(大象),该模型仅有 100B 参数,但在同规模模型中达到 SOTA 水平,且 Token 效率极高。文章通过三个实测场景展示了 Elephant 的能力:修 Bug 时能精准定位问题并以极简方式解决,避免冗余 Token 消耗;处理杂乱会议纪要时能严格遵循指令,剔除无用信息并按 JSON 格式输出,相比 Gem

📌 一句话摘要

蚂蚁 Inclusion AI 团队发布 100B 参数模型 Elephant,主打快、准、省,在 AI BENCHY 评测中 Token 效率和响应速度显著优于同类模型。

📝 详细摘要

本文介绍了蚂蚁 Inclusion AI 团队发布的神秘模型 Elephant(大象),该模型仅有 100B 参数,但在同规模模型中达到 SOTA 水平,且 Token 效率极高。文章通过三个实测场景展示了 Elephant 的能力:修 Bug 时能精准定位问题并以极简方式解决,避免冗余 Token 消耗;处理杂乱会议纪要时能严格遵循指令,剔除无用信息并按 JSON 格式输出,相比 Gemini-2.5-Flash-Lite 输出更简洁;在 Agent 任务中,仅用 10 秒思考、2 秒输出即可完成销售数据分析。AI BENCHY 评测显示,Elephant 输出 Token 维持在 2500 左右,平均响应时间约 1 秒,输出一致性达 9.6/10 分。文章也指出了模型的局限性,包括不擅长复杂长链规划、对非常新的知识可能产生幻觉、对模糊 Prompt 敏感。文章认为,Elephant 代表了 AI 行业从追求大模型向追求智效比的转变,与 OpenAI 的 GPT-5.4 mini/nano 和 Google 的 Gemma 4 趋势一致。

💡 主要观点

- 蚂蚁 Inclusion AI 团队发布 100B 参数模型 Elephant,主打快、准、省。 该模型在同规模模型中达到 SOTA,Token 效率极高,平均响应时间约 1 秒,输出一致性达 9.6/10 分。

Elephant 在修 Bug、会议整理、Agent 等高频场景中表现高效。 实测显示,Elephant 能精准定位代码错误并以极简方式修复;处理杂乱会议纪要时能严格按指令输出结构化结果,Token 消耗远低于 Gemini-2.5-Flash-Lite。
Elephant 存在局限性,包括不擅长复杂长链规划和非常新的知识。 对于需要多工具协作的复杂任务,Elephant 无法独立完成;对刚更新的 SDK 或新特性可能产生 API 幻觉,需要注入最新文档辅助。
Elephant 代表了 AI 行业从追求大模型向追求智效比的转变。 与 OpenAI 的 GPT-5.4 mini/nano 和 Google 的 Gemma 4 趋势一致,轻量化、高性价比模型正在成为 AI 从玩具跨越到生产力工具的底座。

💬 文章金句

- 仅 100B 大小,在同规模模型里是 SOTA,还巨省 Token。

  • Token 浪费,已然成了行业高度重视的关键内容之一。
  • 快、准、省,这三个看似接地气的字眼,正在成为 AI 高效上岗的标准。
  • 做加法的人太多了,需要有人站出来做减法。

📊 文章信息

AI 初评:86

来源:量子位

作者:十三

分类:人工智能

语言:中文

阅读时间:13 分钟

字数:3063

标签: Elephant, 蚂蚁集团, 大语言模型, Token 效率, AI BENCHY

阅读完整文章

查看原文 → 發佈: 2026-04-22 18:29:00 收錄: 2026-04-22 20:00:48

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。