腾讯发布并开源混元 Hy3 preview 旗舰模型,采用快慢思考融合的混合专家架构,在推理、代码与 Agent 能力上进入第一梯队,推理效率提升 40%,API 价格低至 1.2 元/百万 tokens。
📝 详细摘要
本文报道了腾讯新一代大模型混元 Hy3 preview 的发布。该模型是姚顺雨掌舵混元后首次对外亮相的成果,采用快慢思考融合的混合专家架构,总参数 295B,激活参数 21B,支持 256K 上下文。在复杂推理任务中,其 FrontierScience-Olympiad 得分 70.0,IMO Answer Bench 达 84.3,整体表现超过 GLM-5、Kimi-K2.5,接近 Gemini 3.1 Pro 与 GPT-5.4,并在清华求真书院数学博士资格考试中取得 88.4 分的国内最高成绩。在代码与 Agent 能力上,SWE-Bench Verified 达 74.4%,逼近 GLM-5 与 Kimi-K2.5。推理效率提升 40%,首 token 延迟降低 54%,API 输入最低 1.2 元/百万 tokens,输出最低 4 元/百万 tokens。文章还包含作者对模型在 SVG 绘制、交互 HTML、像素风格页面等任务上的实测评估,以及多项基准测试的详细数据对比。
💡 主要观点
- 混元 Hy3 preview 采用快慢思考融合的混合专家架构,295B 总参数,21B 激活参数。 该架构在保持较高性能的同时控制了计算成本,支持最长 256K 上下文,定位为高性价比的通用旗舰模型。
💬 文章金句
- 姚顺雨第一场'大考'交卷!
- 推理效率提 40%,百万 tokens 单价不到一块钱!
- 模型的价值,不在榜单,而在复杂场景中的可用性。
- Hy3 preview 或许是腾讯在这一轮大模型竞争中重新找到节奏的信号。
📊 文章信息
AI 初评:85
来源:智东西
作者:智东西
分类:人工智能
语言:中文
阅读时间:19 分钟
字数:4563
标签: 腾讯混元, Hy3 preview, 大语言模型, 开源模型, 推理效率