蚂蚁 Inclusion AI 团队发布 100B 参数模型 Elephant,主打快、准、省,在 AI BENCHY 评测中 Token 效率和响应速度显著优于同类模型。
📝 详细摘要
本文介绍了蚂蚁 Inclusion AI 团队发布的神秘模型 Elephant(大象),该模型仅有 100B 参数,但在同规模模型中达到 SOTA 水平,且 Token 效率极高。文章通过三个实测场景展示了 Elephant 的能力:修 Bug 时能精准定位问题并以极简方式解决,避免冗余 Token 消耗;处理杂乱会议纪要时能严格遵循指令,剔除无用信息并按 JSON 格式输出,相比 Gemini-2.5-Flash-Lite 输出更简洁;在 Agent 任务中,仅用 10 秒思考、2 秒输出即可完成销售数据分析。AI BENCHY 评测显示,Elephant 输出 Token 维持在 2500 左右,平均响应时间约 1 秒,输出一致性达 9.6/10 分。文章也指出了模型的局限性,包括不擅长复杂长链规划、对非常新的知识可能产生幻觉、对模糊 Prompt 敏感。文章认为,Elephant 代表了 AI 行业从追求大模型向追求智效比的转变,与 OpenAI 的 GPT-5.4 mini/nano 和 Google 的 Gemma 4 趋势一致。
💡 主要观点
- 蚂蚁 Inclusion AI 团队发布 100B 参数模型 Elephant,主打快、准、省。 该模型在同规模模型中达到 SOTA,Token 效率极高,平均响应时间约 1 秒,输出一致性达 9.6/10 分。
💬 文章金句
- 仅 100B 大小,在同规模模型里是 SOTA,还巨省 Token。
- Token 浪费,已然成了行业高度重视的关键内容之一。
- 快、准、省,这三个看似接地气的字眼,正在成为 AI 高效上岗的标准。
- 做加法的人太多了,需要有人站出来做减法。
📊 文章信息
AI 初评:86
来源:量子位
作者:十三
分类:人工智能
语言:中文
阅读时间:13 分钟
字数:3063
标签: Elephant, 蚂蚁集团, 大语言模型, Token 效率, AI BENCHY