← 回總覽

腾讯混元大模型重建第一步,用 Hy3 preview 验证自己的 AI 节奏

📅 2026-04-23 17:25 腾讯科技 人工智能 2 分鐘 1628 字 評分: 88
混元 Hy3 preview 腾讯混元 MoE 架构 大语言模型 AI 落地
📌 一句话摘要 腾讯发布并开源混元 Hy3 preview,这是一款 295B 参数的快慢思考融合 MoE 模型,主打全面实用性,通过深度 Co-Design 与腾讯产品矩阵协同,验证不盲目追求规模、以工程化交付为核心的 AI 落地路线。 📝 详细摘要 本文详细介绍了腾讯于 4 月 23 日发布并开源的新一代大语言模型混元 Hy3 preview。该模型采用快慢思考融合的 MoE 架构,总参数 295B、激活参数 21B,支持 256K 上下文,是混元团队重组后的首个新模型。文章从三个层面展开:首先解释了选择 295B 规模而非万亿参数背后的实用性考量,包括成本、部署和落地可行性;其次分析

📌 一句话摘要

腾讯发布并开源混元 Hy3 preview,这是一款 295B 参数的快慢思考融合 MoE 模型,主打全面实用性,通过深度 Co-Design 与腾讯产品矩阵协同,验证不盲目追求规模、以工程化交付为核心的 AI 落地路线。

📝 详细摘要

本文详细介绍了腾讯于 4 月 23 日发布并开源的新一代大语言模型混元 Hy3 preview。该模型采用快慢思考融合的 MoE 架构,总参数 295B、激活参数 21B,支持 256K 上下文,是混元团队重组后的首个新模型。文章从三个层面展开:首先解释了选择 295B 规模而非万亿参数背后的实用性考量,包括成本、部署和落地可行性;其次分析了模型在指令遵循、长上下文、复杂推理、代码和智能体等四个方向的全面提升,并展示了多个基准测试结果;最后重点阐述了 Hy3 preview 与腾讯新闻、元宝、ima、和平精英、腾讯文档等产品的深度 Co-Design 实践,以及通过 WorkBuddy 等内部工具进行的真实场景测试。文章还引用了腾讯总裁刘炽平和高级执行副总裁汤道生的观点,阐述了腾讯在 AI 竞争中的战略定位——将 AI 视为多维度竞赛,通过系统工程能力将模型能力最大化发挥。

💡 主要观点

- Hy3 preview 选择 295B 参数规模,追求全面实用性而非盲目扩大规模。 300B 量级模型在复杂推理、长上下文等能力上已充分释放,且可实现单机部署,推理成本远低于万亿参数模型,更利于私有化部署和行业适配。

模型在指令遵循、长上下文、复杂推理、代码和智能体四个方向全面提升。 Hy3 preview 不推崇偏科,通过重建预训练和强化学习基础设施,在 SWE-Bench、Terminal-Bench 等代码智能体基准和 BrowseComp 等搜索智能体基准中取得有竞争力结果。
Hy3 preview 的核心策略是与腾讯产品体系深度 Co-Design,实现一模千面。 模型在不同产品中适配出不同感觉,如元宝主打人味儿、ima 长文能力突出、和平精英角色扮演自然,体现了模型在真实业务场景中的实用性和灵活性。
腾讯将 AI 视为多维度竞赛,系统工程能力是关键。 腾讯总裁刘炽平指出 AI 由许多不同比赛构成,汤道生强调 AI 落地不只是一道算法题,更是一道工程题,需要工具调用、分层上下文工程、长记忆管理等脚手架设计。

💬 文章金句

- Hy3 preview 要验证的是一条追求'全面实用性'的路线,打好生态与工程地基,把 AI 真正放进真实业务场景里去跑。

  • 不在所有单项上和头部模型死磕,选择在一个可交付、可运营、可被产品吸收的尺寸上把实用能力做扎实。
  • 适配不同的产品,跑出不同的'模型感觉',这件事本身比任何单项 benchmark 都更能说明 Hy3 preview 的定位。
  • AI 落地'不只是一道算法题,更是一道工程题。'
  • 如果只是在参与一场单一的比赛,那么想要在这场比赛中追赶上来,确实是很困难的。但如果你把 AI 看作是由许多不同'比赛'构成的集合,那么新的机会和新的前沿领域其实一直在不断出现。

📊 文章信息

AI 初评:88

来源:腾讯科技

作者:腾讯科技

分类:人工智能

语言:中文

阅读时间:20 分钟

字数:4930

标签: 混元 Hy3 preview, 腾讯混元, MoE 架构, 大语言模型, AI 落地

阅读完整文章

查看原文 → 發佈: 2026-04-23 17:25:00 收錄: 2026-04-24 06:00:44

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。