Simon Willison 测试了 Z.ai 新推出的 754B 参数模型 GLM-5.1,重点介绍了其出色的 SVG 生成能力以及自主调试复杂 CSS/SVG 动画问题的能力。
📝 详细摘要
本文对中国 AI 实验室 Z.ai 推出的 754B 参数超大规模开源权重模型 GLM-5.1 进行了实测。作者 Simon Willison 使用其标志性的“鹈鹕测试”对模型进行了评估,要求其生成一张骑自行车的鹈鹕的 SVG 图片。该模型展现了高级推理能力,自主提供了一个动画化的 HTML/CSS 版本。尽管最初的动画逻辑存在缺陷,但模型成功诊断出 CSS 变换与 SVG 属性之间的技术冲突,并通过使用 提供了修正版本,不仅修复了定位问题,还增加了诸如晃动的喙囊等精细细节。
💡 主要观点
- GLM-5.1 在长周期任务和复杂资产生成方面取得了显著进展。 模型自主决定将简单的 SVG 请求封装在完整的 HTML/CSS 动画框架中,这表明其具备极高的指令遵循能力和创造性自主权。
💬 文章金句
- 问题在于 SVG 元素上的 CSS 变换动画覆盖了用于定位的 SVG 变换属性,导致鹈鹕失去了位置并飞到了右上角。
- 这个 SVG 非常出色,可能是我目前最喜欢的开源权重模型作品。
- 中国 AI 实验室 Z.ai 的最新模型是一个庞大的 754B 参数、1.51TB 大小且采用 MIT 许可的巨兽。
📊 文章信息
AI 评分:89
来源:Simon Willison's Weblog
作者:Simon Willison
分类:人工智能
语言:英文
阅读时间:2 分钟
字数:287
标签: GLM-5.1, Z.ai, 开源权重, SVG 生成, LLM 测试