GLM-5.1：迈向长周期任务

📌 一句话摘要

Simon Willison 测试了 Z.ai 新推出的 754B 参数模型 GLM-5.1，重点介绍了其出色的 SVG 生成能力以及自主调试复杂 CSS/SVG 动画问题的能力。

📝 详细摘要

本文对中国 AI 实验室 Z.ai 推出的 754B 参数超大规模开源权重模型 GLM-5.1 进行了实测。作者 Simon Willison 使用其标志性的“鹈鹕测试”对模型进行了评估，要求其生成一张骑自行车的鹈鹕的 SVG 图片。该模型展现了高级推理能力，自主提供了一个动画化的 HTML/CSS 版本。尽管最初的动画逻辑存在缺陷，但模型成功诊断出 CSS 变换与 SVG 属性之间的技术冲突，并通过使用提供了修正版本，不仅修复了定位问题，还增加了诸如晃动的喙囊等精细细节。

💡 主要观点

- GLM-5.1 在长周期任务和复杂资产生成方面取得了显著进展。 模型自主决定将简单的 SVG 请求封装在完整的 HTML/CSS 动画框架中，这表明其具备极高的指令遵循能力和创造性自主权。

该模型展现了强大的自调试能力和技术推理能力。 当面对损坏的动画时，模型准确识别出 CSS 变换动画覆盖了用于定位的 SVG 变换属性，并使用原生的 SVG 动画标签提供了技术上合理的修复方案。

开源权重模型在专业创意编码领域正逐渐与顶级闭源模型持平。 生成的 SVG 质量以及对渐变和嵌套动画的复杂运用表明，700B+ 参数的开源模型在复杂的编程任务中正变得极具竞争力。

💬 文章金句

- 问题在于 SVG 元素上的 CSS 变换动画覆盖了用于定位的 SVG 变换属性，导致鹈鹕失去了位置并飞到了右上角。

这个 SVG 非常出色，可能是我目前最喜欢的开源权重模型作品。
中国 AI 实验室 Z.ai 的最新模型是一个庞大的 754B 参数、1.51TB 大小且采用 MIT 许可的巨兽。

📊 文章信息

AI 评分：89

来源：Simon Willison's Weblog

作者：Simon Willison

分类：人工智能

语言：英文

阅读时间：2 分钟

字数：287

标签： GLM-5.1, Z.ai, 开源权重, SVG 生成, LLM 测试

阅读完整文章

GLM-5.1：迈向长周期任务

🤖 問 AI