百度发布文心大模型 5.1,采用多维弹性预训练技术,以业界 6% 的预训练成本实现基础效果领先,并登顶 LMArena 搜索榜国内第一。
📝 详细摘要
文章报道了百度在 5 月 9 日正式发布的新一代基础大模型文心 5.1。该模型的核心亮点在于其采用的「多维弹性预训练」技术,使得预训练成本仅为业界同规模模型的 6%,同时实现了基础效果的领先。在权威基准测试中,文心 5.1 在智能体、知识、推理和深度搜索等方面表现出色,尤其在 Agent 能力上超越了 DeepSeek-V4-Pro。其搜索能力在 LMArena 搜索榜上获得国内第一、全球第四的成绩,是唯一上榜的国产模型。文章还提到,该模型继承了文心 5.0 的知识,并将总参数压缩至约 1/3,激活参数压缩至约 1/2。目前,文心 5.1 已在百度千帆模型广场和文心一言官网上线,面向企业用户和开发者开放体验。
💡 主要观点
- 文心 5.1 采用「多维弹性预训练」技术,大幅降低预训练成本。 该技术使得文心 5.1 的预训练成本仅为业界同规模模型的 6%,同时实现了基础效果的领先,体现了其在训练效率上的显著优势。
💬 文章金句
- 百度发布文心大模型 5.1,采用多维弹性预训练技术,仅以业界同规模模型约 6% 的预训练成本,达到基础效果领先水平。
- LMArena 大模型竞技场最新排名显示,文心 5.1 以 1223 分登上 LMArena 搜索榜国内第一、全球第四,是唯一上榜的国产模型。
- 文心 5.1 作为该技术的阶段性成果,充分继承了文心 5.0 的知识,并将总参数压缩至约 1/3、激活参数压缩至约 1/2。
📊 文章信息
AI 初评:86
来源:量子位
作者:量子位的朋友们
分类:人工智能
语言:中文
阅读时间:3 分钟
字数:717
标签: 文心大模型 5.1, 百度, 大语言模型, 预训练, LMArena