不用人类手写训练框架了！AI 自己写代码，训出 1B 端侧「小钢炮」

📌 一句话摘要

面壁发布 MiniCPM5-1B 端侧模型，该模型由全球首个完全由 AI 编写的生产级训练框架 ForgeTrain 预训练，在 1B 参数下实现超越同级模型的智能密度，并支持低门槛本地部署。

📝 详细摘要

本文报道了面壁智能发布的最新端侧基座模型 MiniCPM5-1B。该模型仅 1B 参数，但在综合知识、数学推理、代码编程等核心能力上超越了 Qwen3.5-0.8B 等同类模型，并在 AA-Index 小尺寸模型榜单上位列第一。文章重点介绍了该模型的三大亮点：一是由全球首个完全由 AI 编写的生产级大模型训练框架 ForgeTrain 参与预训练，训练速度比英伟达 Megatron 快 10%；二是模型部署门槛极低，FP16 权重约 2GB，INT4 量化后仅 0.5GB，支持纯 CPU 和浏览器运行；三是面壁同步开源了高质量预训练数据集 UltraData，并建立了从 L0 到 L4 的分级数据治理体系。文章认为，MiniCPM5-1B 验证了「AI 制造 AI」路线的可行性，并展示了端侧模型在智能密度和工程体系上的突破。

💡 主要观点

- MiniCPM5-1B 以 1B 参数实现超越同级模型的智能密度。 在 AA-Index 小尺寸模型榜单上，MiniCPM5-1B 以 17.9 分位列第一，超越了 Qwen3.5-2B 等更大参数模型，验证了智能密度定律：模型能力提升正从堆参数转向提升数据质量和工程效率。

ForgeTrain 是全球首个完全由 AI 编写的生产级训练框架。 ForgeTrain 使用 Harness + Agent loop 技术，无需人类介入即可编写代码。在 H100 和华为昇腾上，其训练速度均比现有框架（Megatron、MindSpeed）快约 10%，证明了 AI 有能力生产关键系统软件。

MiniCPM5-1B 具备极低的部署门槛，支持多种硬件环境。 模型 INT4 量化后仅 0.5GB，可运行于手机、平板、车机，甚至支持纯 CPU 和浏览器环境。这降低了端侧 AI 应用的开发与部署成本，使本地化、离线可用的 AI 桌宠等应用成为可能。

💬 文章金句

- ForgeTrain 真正要证明的是 AI 能不能写出一套能支撑真实模型训练的生产级系统软件。

MiniCPM5-1B 不只是一个模型版本，它更像是一次真实压力测试：AI 写出的训练框架，已经开始参与训练新的 AI 模型。
在英伟达 H100 GPU 上，ForgeTrain 的训练效果与 Megatron 对齐，速度领先 10%。
端侧模型的主战场就是智能密度。MiniCPM5-1B 的意义正在于此：一个足够小的模型，也可以在合适的工程体系支撑下，进入个人电脑、手机、车机和边缘设备。

📊 文章信息

AI 初评：86

来源：机器之心

作者：机器之心

分类：人工智能

语言：中文

阅读时间：22 分钟

字数：5465

标签： MiniCPM5-1B, 端侧模型, ForgeTrain, AI 制造 AI, 智能密度

阅读完整文章

不用人类手写训练框架了！AI 自己写代码，训出 1B 端侧「小钢炮」

🤖 問 AI