今天，姚顺雨在 DeepSeek V4 前交卷了

📌 一句话摘要

腾讯发布并开源混元 Hy3 preview 旗舰模型，采用快慢思考融合的混合专家架构，在推理、代码与 Agent 能力上进入第一梯队，推理效率提升 40%，API 价格低至 1.2 元/百万 tokens。

📝 详细摘要

本文报道了腾讯新一代大模型混元 Hy3 preview 的发布。该模型是姚顺雨掌舵混元后首次对外亮相的成果，采用快慢思考融合的混合专家架构，总参数 295B，激活参数 21B，支持 256K 上下文。在复杂推理任务中，其 FrontierScience-Olympiad 得分 70.0，IMO Answer Bench 达 84.3，整体表现超过 GLM-5、Kimi-K2.5，接近 Gemini 3.1 Pro 与 GPT-5.4，并在清华求真书院数学博士资格考试中取得 88.4 分的国内最高成绩。在代码与 Agent 能力上，SWE-Bench Verified 达 74.4%，逼近 GLM-5 与 Kimi-K2.5。推理效率提升 40%，首 token 延迟降低 54%，API 输入最低 1.2 元/百万 tokens，输出最低 4 元/百万 tokens。文章还包含作者对模型在 SVG 绘制、交互 HTML、像素风格页面等任务上的实测评估，以及多项基准测试的详细数据对比。

💡 主要观点

- 混元 Hy3 preview 采用快慢思考融合的混合专家架构，295B 总参数，21B 激活参数。 该架构在保持较高性能的同时控制了计算成本，支持最长 256K 上下文，定位为高性价比的通用旗舰模型。

在复杂推理、代码与 Agent 能力上进入第一梯队，多项基准超越 GLM-5 和 Kimi-K2.5。 FrontierScience-Olympiad 得分 70.0，IMO Answer Bench 达 84.3，SWE-Bench Verified 达 74.4%，整体表现接近 Gemini 3.1 Pro 与 GPT-5.4 等顶级闭源模型。

推理效率提升 40%，API 定价极具竞争力，最低 1.2 元/百万 tokens。 首 token 延迟降低 54%，端到端时长下降 47%，并提供最低 28 元/月的 Token 套餐，大幅降低开发者使用门槛。

模型已接入腾讯多条核心产品线，并支持开源智能体生态。 已接入腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ 等产品，并支持 OpenClaw、OpenCode 等开源智能体框架。

💬 文章金句

- 姚顺雨第一场'大考'交卷！

推理效率提 40%，百万 tokens 单价不到一块钱！
模型的价值，不在榜单，而在复杂场景中的可用性。
Hy3 preview 或许是腾讯在这一轮大模型竞争中重新找到节奏的信号。

📊 文章信息

AI 初评：85

来源：智东西

作者：智东西

分类：人工智能

语言：中文

阅读时间：19 分钟

字数：4563

标签：腾讯混元, Hy3 preview, 大语言模型, 开源模型, 推理效率

阅读完整文章

今天，姚顺雨在 DeepSeek V4 前交卷了

🤖 問 AI