智谱 AI 因新发布的 GLM-5.1 模型性能卓越导致 API 调用量暴涨 400%,后台资源过载出现限速与宕机现象。
📝 详细摘要
2026 年 4 月 9 日,智谱 AI 的 API 服务因用户调用量激增出现大规模限速和宕机。此次事故的主要诱因是昨日发布的 GLM-5.1 模型表现强劲,在 SWE-Bench Pro 等基准测试中位居开源首位,并具备极强的长时程智能体能力。尽管智谱近期大幅上调了 API 价格,但市场需求不降反升,反映出 2026 年全球对高质量 AI 推理算力的极度渴求以及顶尖模型供应紧张的现状。
💡 主要观点
- 智谱 API 因 GLM-5.1 发布后的流量冲击出现服务中断。 新模型在编程和智能体任务上的卓越表现吸引了全球开发者疯狂涌入,导致后台资源被撑爆。
💬 文章金句
- GLM-5.1 一举夺得全球开源模型第一的宝座,仅次于闭源的 GPT-5.4 和 Claude Opus 4.6。
- 调用量不降反升,逆势增长了 400%。甚至出现了产品售罄、限售的供不应求局面。
- 推理侧算力的供给已经成为了大家享用优秀顶尖模型的一大限制了!
📊 文章信息
AI 评分:82
来源:51CTO技术栈
作者:51CTO技术栈
分类:人工智能
语言:中文
阅读时间:3 分钟
字数:633
标签: 智谱AI, GLM-5.1, API宕机, 推理算力, 大模型资讯