8B 参数，最强开源文生图模型，对标 NBP，24G 显卡就能跑…

📌 一句话摘要

本文对百度新开源的 8B 参数文生图模型 ERNIE-Image 进行了实测评估，展示了其在复杂提示词遵循、中文支持、多场景应用（如角色设定、漫画、PPT、信息图等）上的出色表现，并客观分析了其与顶级模型 NBP 的差距及本地部署优势。

📝 详细摘要

文章详细评测了百度最新开源的文生图模型 ERNIE-Image。该模型仅 8B 参数，号称 24G 显存即可本地运行。作者通过大量实测案例，系统评估了其能力：在复杂提示词遵循、中文支持、推理速度方面表现优异，尤其在角色设定图、四格漫画、九宫格服装搭配、PPT、信息图、数据大屏等结构化、多元素场景下生成效果出色。文章也客观指出了其与顶级模型 NBP 在真实感、长文本渲染稳定性等方面的差距。整体评价积极，认为其在小参数规模下实现了强大的指令遵循能力，是本地部署的福音，并展望了社区微调（LoRA）后的潜力。

💡 主要观点

- ERNIE-Image 在 8B 小参数量下展现出强大的复杂指令遵循能力。 模型能准确理解并生成包含大量细节描述、结构化布局（如九宫格、分镜）的复杂提示词，在角色设定、漫画、信息图等场景中表现突出。

模型对中文支持良好，且在多种实用场景（PPT、数据大屏、旅行手帐）中生成效果可用。 评测覆盖了从创意设计到企业汇报的广泛场景，模型能生成符合中文语境和特定风格要求的内容，展现了较强的泛化能力和实用价值。

24G 显存即可本地部署是其核心优势，但部分场景效果与顶级模型仍有差距。 文章客观指出，在真实感、极长文本的稳定渲染等方面，ERNIE-Image 与 NBP 等顶级模型存在差距，但其低部署门槛是巨大优势。

💬 文章金句

- 本来以为 8B 模型就那样，但没想到 ERNIE-Image 对复杂提示词的遵循效果还不错。

对比较复杂 Prompt 遵循能力很好，一些细节描述也能表现出来。
但确实一些场景上，跟 nbp 还是有差距的，比如部分真实感等。
测完之后，感觉 ERNIE-Image，8B 参数确实有亿点强，指令遵循、复杂场景都很不错。
但胜在小，能本地部署呀，感觉后面社区出一大堆 lora 的时候，效果会更好。

📊 文章信息

AI 初评：84

来源：大模型智能

作者：大模型智能

分类：人工智能

语言：中文

阅读时间：16 分钟

字数：3819

标签：文生图模型, ERNIE-Image, AIGC, 模型评测, 开源模型

阅读完整文章

8B 参数，最强开源文生图模型，对标 NBP，24G 显卡就能跑…

🤖 問 AI