daVinci-MagiHuman 是一个从头预训练的 15B 多语言人像生成模型,采用单流 Transformer 架构,在开源领域表现优异。
📝 详细摘要
该推文介绍了 daVinci-MagiHuman 模型。根据引用内容,这是一个 15B 参数的单流 Transformer 模型,无需交叉注意力机制,支持多语言,并在人像生成任务中表现出极高的竞争力(对比 Ovi 1.1 和 LTX 2.3 具有优势)。其特点是架构简洁、推理速度快(单张 H100 在 38 秒内生成 5 秒 1080p 视频),且完全开源。作者对其与 daVinci agent 的结合表示期待。
📊 文章信息
AI 评分:81
来源:马东锡 NLP(@dongxi_nlp)
作者:马东锡 NLP
分类:人工智能
语言:中文
阅读时间:1 分钟
字数:160
标签: daVinci-MagiHuman, AI 模型, 开源, 多模态, 人像生成