本文对百度新开源的 8B 参数文生图模型 ERNIE-Image 进行了实测评估,展示了其在复杂提示词遵循、中文支持、多场景应用(如角色设定、漫画、PPT、信息图等)上的出色表现,并客观分析了其与顶级模型 NBP 的差距及本地部署优势。
📝 详细摘要
文章详细评测了百度最新开源的文生图模型 ERNIE-Image。该模型仅 8B 参数,号称 24G 显存即可本地运行。作者通过大量实测案例,系统评估了其能力:在复杂提示词遵循、中文支持、推理速度方面表现优异,尤其在角色设定图、四格漫画、九宫格服装搭配、PPT、信息图、数据大屏等结构化、多元素场景下生成效果出色。文章也客观指出了其与顶级模型 NBP 在真实感、长文本渲染稳定性等方面的差距。整体评价积极,认为其在小参数规模下实现了强大的指令遵循能力,是本地部署的福音,并展望了社区微调(LoRA)后的潜力。
💡 主要观点
- ERNIE-Image 在 8B 小参数量下展现出强大的复杂指令遵循能力。 模型能准确理解并生成包含大量细节描述、结构化布局(如九宫格、分镜)的复杂提示词,在角色设定、漫画、信息图等场景中表现突出。
💬 文章金句
- 本来以为 8B 模型就那样,但没想到 ERNIE-Image 对复杂提示词的遵循效果还不错。
- 对比较复杂 Prompt 遵循能力很好,一些细节描述也能表现出来。
- 但确实一些场景上,跟 nbp 还是有差距的,比如部分真实感等。
- 测完之后,感觉 ERNIE-Image,8B 参数确实有亿点强,指令遵循、复杂场景都很不错。
- 但胜在小,能本地部署呀,感觉后面社区出一大堆 lora 的时候,效果会更好。
📊 文章信息
AI 初评:84
来源:大模型智能
作者:大模型智能
分类:人工智能
语言:中文
阅读时间:16 分钟
字数:3819
标签: 文生图模型, ERNIE-Image, AIGC, 模型评测, 开源模型