腾讯混元大模型重建第一步，用 Hy3 preview 验证自己的 AI 节奏

📌 一句话摘要

腾讯发布并开源混元 Hy3 preview，这是一款 295B 参数的快慢思考融合 MoE 模型，主打全面实用性，通过深度 Co-Design 与腾讯产品矩阵协同，验证不盲目追求规模、以工程化交付为核心的 AI 落地路线。

📝 详细摘要

本文详细介绍了腾讯于 4 月 23 日发布并开源的新一代大语言模型混元 Hy3 preview。该模型采用快慢思考融合的 MoE 架构，总参数 295B、激活参数 21B，支持 256K 上下文，是混元团队重组后的首个新模型。文章从三个层面展开：首先解释了选择 295B 规模而非万亿参数背后的实用性考量，包括成本、部署和落地可行性；其次分析了模型在指令遵循、长上下文、复杂推理、代码和智能体等四个方向的全面提升，并展示了多个基准测试结果；最后重点阐述了 Hy3 preview 与腾讯新闻、元宝、ima、和平精英、腾讯文档等产品的深度 Co-Design 实践，以及通过 WorkBuddy 等内部工具进行的真实场景测试。文章还引用了腾讯总裁刘炽平和高级执行副总裁汤道生的观点，阐述了腾讯在 AI 竞争中的战略定位——将 AI 视为多维度竞赛，通过系统工程能力将模型能力最大化发挥。

💡 主要观点

- Hy3 preview 选择 295B 参数规模，追求全面实用性而非盲目扩大规模。 300B 量级模型在复杂推理、长上下文等能力上已充分释放，且可实现单机部署，推理成本远低于万亿参数模型，更利于私有化部署和行业适配。

模型在指令遵循、长上下文、复杂推理、代码和智能体四个方向全面提升。 Hy3 preview 不推崇偏科，通过重建预训练和强化学习基础设施，在 SWE-Bench、Terminal-Bench 等代码智能体基准和 BrowseComp 等搜索智能体基准中取得有竞争力结果。

Hy3 preview 的核心策略是与腾讯产品体系深度 Co-Design，实现一模千面。 模型在不同产品中适配出不同感觉，如元宝主打人味儿、ima 长文能力突出、和平精英角色扮演自然，体现了模型在真实业务场景中的实用性和灵活性。

腾讯将 AI 视为多维度竞赛，系统工程能力是关键。 腾讯总裁刘炽平指出 AI 由许多不同比赛构成，汤道生强调 AI 落地不只是一道算法题，更是一道工程题，需要工具调用、分层上下文工程、长记忆管理等脚手架设计。

💬 文章金句

- Hy3 preview 要验证的是一条追求'全面实用性'的路线，打好生态与工程地基，把 AI 真正放进真实业务场景里去跑。

不在所有单项上和头部模型死磕，选择在一个可交付、可运营、可被产品吸收的尺寸上把实用能力做扎实。
适配不同的产品，跑出不同的'模型感觉'，这件事本身比任何单项 benchmark 都更能说明 Hy3 preview 的定位。
AI 落地'不只是一道算法题，更是一道工程题。'
如果只是在参与一场单一的比赛，那么想要在这场比赛中追赶上来，确实是很困难的。但如果你把 AI 看作是由许多不同'比赛'构成的集合，那么新的机会和新的前沿领域其实一直在不断出现。

📊 文章信息

AI 初评：88

来源：腾讯科技

作者：腾讯科技

分类：人工智能

语言：中文

阅读时间：20 分钟

字数：4930

标签：混元 Hy3 preview, 腾讯混元, MoE 架构, 大语言模型, AI 落地

阅读完整文章

腾讯混元大模型重建第一步，用 Hy3 preview 验证自己的 AI 节奏

🤖 問 AI