← 回總覽

不用人类手写训练框架了!AI 自己写代码,训出 1B 端侧「小钢炮」

📅 2026-05-26 13:16 机器之心 人工智能 2 分鐘 1582 字 評分: 86
MiniCPM5-1B 端侧模型 ForgeTrain AI 制造 AI 智能密度
📌 一句话摘要 面壁发布 MiniCPM5-1B 端侧模型,该模型由全球首个完全由 AI 编写的生产级训练框架 ForgeTrain 预训练,在 1B 参数下实现超越同级模型的智能密度,并支持低门槛本地部署。 📝 详细摘要 本文报道了面壁智能发布的最新端侧基座模型 MiniCPM5-1B。该模型仅 1B 参数,但在综合知识、数学推理、代码编程等核心能力上超越了 Qwen3.5-0.8B 等同类模型,并在 AA-Index 小尺寸模型榜单上位列第一。文章重点介绍了该模型的三大亮点:一是由全球首个完全由 AI 编写的生产级大模型训练框架 ForgeTrain 参与预训练,训练速度比英伟达 Me

📌 一句话摘要

面壁发布 MiniCPM5-1B 端侧模型,该模型由全球首个完全由 AI 编写的生产级训练框架 ForgeTrain 预训练,在 1B 参数下实现超越同级模型的智能密度,并支持低门槛本地部署。

📝 详细摘要

本文报道了面壁智能发布的最新端侧基座模型 MiniCPM5-1B。该模型仅 1B 参数,但在综合知识、数学推理、代码编程等核心能力上超越了 Qwen3.5-0.8B 等同类模型,并在 AA-Index 小尺寸模型榜单上位列第一。文章重点介绍了该模型的三大亮点:一是由全球首个完全由 AI 编写的生产级大模型训练框架 ForgeTrain 参与预训练,训练速度比英伟达 Megatron 快 10%;二是模型部署门槛极低,FP16 权重约 2GB,INT4 量化后仅 0.5GB,支持纯 CPU 和浏览器运行;三是面壁同步开源了高质量预训练数据集 UltraData,并建立了从 L0 到 L4 的分级数据治理体系。文章认为,MiniCPM5-1B 验证了「AI 制造 AI」路线的可行性,并展示了端侧模型在智能密度和工程体系上的突破。

💡 主要观点

- MiniCPM5-1B 以 1B 参数实现超越同级模型的智能密度。 在 AA-Index 小尺寸模型榜单上,MiniCPM5-1B 以 17.9 分位列第一,超越了 Qwen3.5-2B 等更大参数模型,验证了智能密度定律:模型能力提升正从堆参数转向提升数据质量和工程效率。

ForgeTrain 是全球首个完全由 AI 编写的生产级训练框架。 ForgeTrain 使用 Harness + Agent loop 技术,无需人类介入即可编写代码。在 H100 和华为昇腾上,其训练速度均比现有框架(Megatron、MindSpeed)快约 10%,证明了 AI 有能力生产关键系统软件。
MiniCPM5-1B 具备极低的部署门槛,支持多种硬件环境。 模型 INT4 量化后仅 0.5GB,可运行于手机、平板、车机,甚至支持纯 CPU 和浏览器环境。这降低了端侧 AI 应用的开发与部署成本,使本地化、离线可用的 AI 桌宠等应用成为可能。

💬 文章金句

- ForgeTrain 真正要证明的是 AI 能不能写出一套能支撑真实模型训练的生产级系统软件。

  • MiniCPM5-1B 不只是一个模型版本,它更像是一次真实压力测试:AI 写出的训练框架,已经开始参与训练新的 AI 模型。
  • 在英伟达 H100 GPU 上,ForgeTrain 的训练效果与 Megatron 对齐,速度领先 10%。
  • 端侧模型的主战场就是智能密度。MiniCPM5-1B 的意义正在于此:一个足够小的模型,也可以在合适的工程体系支撑下,进入个人电脑、手机、车机和边缘设备。

📊 文章信息

AI 初评:86

来源:机器之心

作者:机器之心

分类:人工智能

语言:中文

阅读时间:22 分钟

字数:5465

标签: MiniCPM5-1B, 端侧模型, ForgeTrain, AI 制造 AI, 智能密度

阅读完整文章

查看原文 → 發佈: 2026-05-26 13:16:00 收錄: 2026-05-26 20:00:36

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。