百度宣布其开源的文生图模型 ERNIE-Image 在 SuperCLUE-Image 最新测评中位列国内第一、全球第四,并在图文一致性和汉字生成两个细分榜单中取得国内榜首。
📝 详细摘要
本文是百度 AI 官方发布的公告,宣布其近期开源的文生图模型 ERNIE-Image 在 SuperCLUE-Image 中文文生图测评中取得了优异成绩。模型以 76.37 分的总分位列国产大模型第一,全球第四,仅次于 OpenAI 的 GPT-Image-1.5。在图文一致性和汉字生成两个关键细分能力上,ERNIE-Image 均位居国内榜首。文章简要介绍了 ERNIE-Image 的模型特点,包括基于 DiT 架构、8B 参数量、对消费级显卡友好(24GB 显存)以及在实际应用中展现出的复杂指令理解、清晰文字渲染和多风格图像生成能力。
💡 主要观点
- ERNIE-Image 在权威测评中证明其国内领先实力。 在 SuperCLUE-Image 涵盖 18 个主流模型的测评中,ERNIE-Image 总分位列国产第一、全球第四,尤其在图文一致性和汉字生成两个关键中文场景能力上表现突出。
💬 文章金句
- 刚开源不久的 ERNIE-Image 模型,在最新 SuperCLUE-Image 中文文生图测评中,拿下国内第一、全球第四的成绩。
- 在图文一致性、汉字生成两类细分榜单中均为国内榜首。
- 仅用 8B 轻量参数,就做到了顶尖的生成效果,不管是复杂指令理解、清晰文字渲染,还是海报、漫画、写实风等各类图像创作,都能轻松拿捏,实用性拉满。
- ERNIE-Image 基于 DiT 架构设计,参数量为 80 亿(8B),只需 24GB 显存的消费级显卡,即可生成媲美顶级商业模型的复杂、真实图像。
📊 文章信息
AI 初评:81
来源:百度AI
作者:百度AI
分类:人工智能
语言:中文
阅读时间:3 分钟
字数:705
标签: 文生图, ERNIE-Image, 百度文心, 模型评测, SuperCLUE