本文汇总了面壁智能 MiniCPM-V 4.6、ELF 连续扩散语言模型、DreamLite 端侧扩散模型等多项开源 AI 项目的最新进展,覆盖基座模型、框架工具和数据指令三大方向。
📝 详细摘要
文章以信息聚合形式介绍了 2026 年 5 月 13 日的多项开源 AI 项目。基座模型方面,面壁智能推出 MiniCPM-V 4.6,基于 SigLIP2-400M 和 Qwen3.5-0.8B,支持混合视觉 token 压缩,可部署于 iOS/安卓/鸿蒙平台;ELF 是基于连续时间流匹配的扩散语言模型,在文本生成、翻译等任务上性能优于同类模型;DreamLite 是仅 0.39B 参数的端侧统一扩散模型,支持文生图和图像编辑,在 iPhone 17 Pro 上约 3 秒生成 1024×1024 图像。框架工具方面,Memoir 为 AI Agent 提供类 Git 版本控制的语义内存系统;Codebuff 是开源 AI 编码助手,采用多 Agent 协作架构;OneVL 面向自动驾驶场景的 VLA 框架。数据指令方面,RealAppliance 是面向家电说明书理解的多任务数据集。文章为每个项目提供了简要介绍和 SOTA 模型平台的一键收藏链接。
💡 主要观点
- MiniCPM-V 4.6 面向端侧多模态理解,支持混合视觉 token 压缩。 基于 SigLIP2-400M 和 Qwen3.5-0.8B,支持 4x/16x 混合压缩,可部署于 iOS、安卓、鸿蒙平台,适合移动端高效多模态场景。
💬 文章金句
- MiniCPM-V 4.6 是 OpenBMB 推出的端侧友好型多模态大模型,基于 SigLIP2-400M 视觉编码器和 Qwen3.5-0.8B 大语言模型构建。
- ELF 是基于连续时间流匹配的连续扩散语言模型,运算过程主要在连续嵌入空间进行。
- DreamLite 是参数规模仅 0.39B 的端侧统一扩散模型,单架构同时支持文生图和文本引导图像编辑。
- Memoir 是面向 AI Agent 的高性能语义内存系统,为 AI 内存管理提供类 Git 版本控制能力。
📊 文章信息
AI 初评:82
来源:机器之心SOTA模型
作者:机器之心SOTA模型
分类:人工智能
语言:中文
阅读时间:6 分钟
字数:1424
标签: 开源项目, MiniCPM-V 4.6, 扩散语言模型, 端侧部署, AI Agent