← 回總覽

今日开源(2026-5-26):面壁智能发布 MiniCPM5,端侧 1B 稠密模型开源,长上下文与混合推理支撑本地部署

📅 2026-05-26 18:47 机器之心SOTA模型 人工智能 2 分鐘 1543 字 評分: 80
开源项目 MiniCPM5 端侧模型 1.58位训练 Agent运行时
📌 一句话摘要 本文汇总了 2026 年 5 月 26 日的 6 个开源项目,涵盖面壁智能的端侧模型 MiniCPM5、基于昇腾的 1.58 位训练系统 BitCPM-CANN、谷歌分布式 Agent 运行时 AX 等,覆盖模型、框架、工具和学术研究。 📝 详细摘要 本文是机器之心 SOTA 模型频道发布的每日开源项目汇总,精选了 2026 年 5 月 26 日的 6 个代表性开源项目。核心内容包括:面壁智能发布的 MiniCPM5-1B 端侧稠密模型,支持 131k 长上下文和混合推理,在同规模模型中达到 SOTA;基于华为昇腾 NPU 的 1.58 位训练系统 BitCPM-CANN,

📌 一句话摘要

本文汇总了 2026 年 5 月 26 日的 6 个开源项目,涵盖面壁智能的端侧模型 MiniCPM5、基于昇腾的 1.58 位训练系统 BitCPM-CANN、谷歌分布式 Agent 运行时 AX 等,覆盖模型、框架、工具和学术研究。

📝 详细摘要

本文是机器之心 SOTA 模型频道发布的每日开源项目汇总,精选了 2026 年 5 月 26 日的 6 个代表性开源项目。核心内容包括:面壁智能发布的 MiniCPM5-1B 端侧稠密模型,支持 131k 长上下文和混合推理,在同规模模型中达到 SOTA;基于华为昇腾 NPU 的 1.58 位训练系统 BitCPM-CANN,推理显存减少约 6 倍;谷歌开源的分布式 Agent 运行时 AX,支持故障恢复与执行续跑;智能体指令共享仓库 agent-scripts;ACL2026 收录的流式视频理解框架 Response-G1;以及面向地理空间推理的 Agent 代码库 Spatial-Agent。文章以项目简介和链接为主,属于信息聚合类内容。

💡 主要观点

- 面壁智能发布 MiniCPM5-1B 端侧稠密模型,支持 131k 长上下文和混合推理。 该模型面向端侧和资源受限场景,在同规模开源模型中达到 SOTA,适用于本地助手、编码 Agent 和工具调用等场景。

BitCPM-CANN 是基于华为昇腾 NPU 的 1.58 位训练系统,推理显存减少约 6 倍。 该系统集成量化感知训练到 Megatron-LM 框架,覆盖全栈训练流程,0.5B 参数版本可像全精度模型直接加载推理,性能损失极低。
谷歌开源分布式 Agent 运行时 AX,支持故障恢复与执行续跑。 AX 可协调 Agent 执行循环、管理流程并记录事件,不受底层框架与模型限制,适配复杂分布式部署场景。
Response-G1 是 ACL2026 收录的免微调流式视频理解框架。 该框架通过共享场景图谱表示对齐累计视频证据与查询专属响应条件,在流式视频理解基准上表现优异,响应时机判断更准确。

💬 文章金句

- MiniCPM5-1B 是 MiniCPM5 系列的首个 1B 参数稠密 Transformer 模型,面向端侧、本地部署、资源受限场景研发,在同规模开源模型中达到 SOTA 水平。

  • BitCPM-CANN 是原生基于华为昇腾 NPU 打造的端到端 1.58 位(三值)大语言模型训练系统,推理显存减少约 6 倍,性能损失极低。
  • AX 是谷歌开源的分布式 Agent 运行时,可协调 Agent 执行循环、管理执行流程并记录事件,原生具备故障恢复与执行续跑能力。

📊 文章信息

AI 初评:80

来源:机器之心SOTA模型

作者:机器之心SOTA模型

分类:人工智能

语言:中文

阅读时间:5 分钟

字数:1064

标签: 开源项目, MiniCPM5, 端侧模型, 1.58位训练, Agent运行时

阅读完整文章

查看原文 → 發佈: 2026-05-26 18:47:00 收錄: 2026-05-27 04:00:36

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。