智谱发布旗舰模型 GLM-5.1 并同步上线华为云,该模型在 Coding 能力及长程任务处理上实现突破,支持单次自主工作 8 小时。
📝 详细摘要
4 月 8 日,智谱正式发布新一代旗舰模型 GLM-5.1,并实现「Day0」上线华为云。该模型在 Coding 能力上刷新了 SWE-bench Pro 基准测试的全球纪录,并具备强大的长程任务处理能力,可自主持续工作 8 小时交付工程级成果。华为云通过昇腾算力优化及系统级推理加速,使整体吞吐提升 30%。目前,开发者可通过华为云 MaaS、CodeArts、AgentArts 及 Flexus 等多款产品体验该模型的能力。
💡 主要观点
- GLM-5.1 在 Coding 和长程任务处理上实现显著突破。 模型在 SWE-bench Pro 测试中刷新纪录,并能在单次任务中持续、自主工作长达 8 小时,标志着 AI 从简单对话向交付完整工程成果的转变。
💬 文章金句
- 能够在单次任务中持续、自主地工作长达 8 小时,交付完整的工程级成果。
- 智谱 GLM-5.1 在最接近真实软件开发的 SWE-bench Pro 基准测试中,刷新全球最佳成绩。
- 华为云通过系统级优化,实现推理加速,整体吞吐提升 30%。
📊 文章信息
AI 评分:87
来源:量子位
作者:量子位的朋友们
分类:人工智能
语言:中文
阅读时间:4 分钟
字数:867
标签: GLM-5.1, 智谱 AI, 华为云, Coding 能力, 长程任务