阿里在千问 APP 上线全能创作模型 Wan2.7,支持高精度图像定制、音视频同步生成及视频续写等功能,主打技术普惠与人人创作。
📝 详细摘要
本文详细评测了阿里最新集成在千问 APP 中的 Wan2.7 多模态模型。该模型在图像生成方面实现了史诗级增强,支持 3K 超长提示词输入、精准的 8 色 HEX 色彩控制以及细致的人脸五官定制(骨相、眼神、皮肤纹理);在视频领域则展现了全栈能力,包括文/图/音生视频、视频局部编辑(局部替换)、动作模仿以及视频续写。实测显示,Wan2.7 在人物表情自然度、镜头衔接流畅度及中英文字渲染上表现优异。文章指出,在硅谷巨头战略收缩视频生成投入的背景下,阿里通过将顶尖模型下放移动端,旨在降低创作门槛,推动 AI 内容生成的工程化落地。
💡 主要观点
- Wan2.7-Image 实现高精度图像定制与色彩控制。 支持 8 色 HEX 精准控制及 3K token 超长文本输入,能精细刻画五官细节,有效解决了 AI 绘图中的色彩偏差与复杂指令理解痛点。
💬 文章金句
- 技术领先只是大模型的入场券,技术普惠才是产品真正的护城河。
- Wan2.7-Image 在人类偏好盲测评分中位列国内生成模型第一,超过 GPT Image 1.5。
- 未来制作爆款视频和精美图像就会变得像点外卖、刷视频一样简单,到那一刻,才是真正打开了人人 AI 创作的大门。
📊 文章信息
AI 评分:87
来源:量子位
作者:鹭羽
分类:人工智能
语言:中文
阅读时间:13 分钟
字数:3154
标签: Wan2.7, 千问 APP, 阿里云, 多模态模型, 视频生成