← 回總覽

今天,姚顺雨在 DeepSeek V4 前交卷了

📅 2026-04-23 18:26 智东西 人工智能 2 分鐘 1502 字 評分: 85
腾讯混元 Hy3 preview 大语言模型 开源模型 推理效率
📌 一句话摘要 腾讯发布并开源混元 Hy3 preview 旗舰模型,采用快慢思考融合的混合专家架构,在推理、代码与 Agent 能力上进入第一梯队,推理效率提升 40%,API 价格低至 1.2 元/百万 tokens。 📝 详细摘要 本文报道了腾讯新一代大模型混元 Hy3 preview 的发布。该模型是姚顺雨掌舵混元后首次对外亮相的成果,采用快慢思考融合的混合专家架构,总参数 295B,激活参数 21B,支持 256K 上下文。在复杂推理任务中,其 FrontierScience-Olympiad 得分 70.0,IMO Answer Bench 达 84.3,整体表现超过 GLM-

📌 一句话摘要

腾讯发布并开源混元 Hy3 preview 旗舰模型,采用快慢思考融合的混合专家架构,在推理、代码与 Agent 能力上进入第一梯队,推理效率提升 40%,API 价格低至 1.2 元/百万 tokens。

📝 详细摘要

本文报道了腾讯新一代大模型混元 Hy3 preview 的发布。该模型是姚顺雨掌舵混元后首次对外亮相的成果,采用快慢思考融合的混合专家架构,总参数 295B,激活参数 21B,支持 256K 上下文。在复杂推理任务中,其 FrontierScience-Olympiad 得分 70.0,IMO Answer Bench 达 84.3,整体表现超过 GLM-5、Kimi-K2.5,接近 Gemini 3.1 Pro 与 GPT-5.4,并在清华求真书院数学博士资格考试中取得 88.4 分的国内最高成绩。在代码与 Agent 能力上,SWE-Bench Verified 达 74.4%,逼近 GLM-5 与 Kimi-K2.5。推理效率提升 40%,首 token 延迟降低 54%,API 输入最低 1.2 元/百万 tokens,输出最低 4 元/百万 tokens。文章还包含作者对模型在 SVG 绘制、交互 HTML、像素风格页面等任务上的实测评估,以及多项基准测试的详细数据对比。

💡 主要观点

- 混元 Hy3 preview 采用快慢思考融合的混合专家架构,295B 总参数,21B 激活参数。 该架构在保持较高性能的同时控制了计算成本,支持最长 256K 上下文,定位为高性价比的通用旗舰模型。

在复杂推理、代码与 Agent 能力上进入第一梯队,多项基准超越 GLM-5 和 Kimi-K2.5。 FrontierScience-Olympiad 得分 70.0,IMO Answer Bench 达 84.3,SWE-Bench Verified 达 74.4%,整体表现接近 Gemini 3.1 Pro 与 GPT-5.4 等顶级闭源模型。
推理效率提升 40%,API 定价极具竞争力,最低 1.2 元/百万 tokens。 首 token 延迟降低 54%,端到端时长下降 47%,并提供最低 28 元/月的 Token 套餐,大幅降低开发者使用门槛。
模型已接入腾讯多条核心产品线,并支持开源智能体生态。 已接入腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ 等产品,并支持 OpenClaw、OpenCode 等开源智能体框架。

💬 文章金句

- 姚顺雨第一场'大考'交卷!

  • 推理效率提 40%,百万 tokens 单价不到一块钱!
  • 模型的价值,不在榜单,而在复杂场景中的可用性。
  • Hy3 preview 或许是腾讯在这一轮大模型竞争中重新找到节奏的信号。

📊 文章信息

AI 初评:85

来源:智东西

作者:智东西

分类:人工智能

语言:中文

阅读时间:19 分钟

字数:4563

标签: 腾讯混元, Hy3 preview, 大语言模型, 开源模型, 推理效率

阅读完整文章

查看原文 → 發佈: 2026-04-23 18:26:00 收錄: 2026-04-24 00:00:43

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。