← 回總覽

腾讯 Hy3 preview 来了!姚顺雨印迹明显,混元重回牌桌|附实测

📅 2026-04-24 08:42 硅星人Pro 人工智能 2 分鐘 1282 字 評分: 82
腾讯 Hy3 preview 混元大模型 姚顺雨 模型评测
📌 一句话摘要 本文通过四项实测,评估了腾讯新发布的 Hy3 preview 模型在代码生成、信息核实、上下文理解和 Agent 能力上的表现,认为其补齐了腾讯在基座模型上的短板,让 AI 产品有底气使用自家基座。 📝 详细摘要 文章围绕腾讯 4 月 23 日发布的 Hy3 preview 模型展开实测,该模型为 295B 总参数、21B 激活参数的 MoE 架构,定位解决真实世界复杂工程问题。作者设计了四项测试:个人展示页代码生成(展现审美与动效)、鱼油争议信息核实(展现多信源交叉验证与信度评分)、虚构工业手册上下文理解(展现规则遵循能力)、世界杯赛程网页 Agent 任务(展现工具调用

📌 一句话摘要

本文通过四项实测,评估了腾讯新发布的 Hy3 preview 模型在代码生成、信息核实、上下文理解和 Agent 能力上的表现,认为其补齐了腾讯在基座模型上的短板,让 AI 产品有底气使用自家基座。

📝 详细摘要

文章围绕腾讯 4 月 23 日发布的 Hy3 preview 模型展开实测,该模型为 295B 总参数、21B 激活参数的 MoE 架构,定位解决真实世界复杂工程问题。作者设计了四项测试:个人展示页代码生成(展现审美与动效)、鱼油争议信息核实(展现多信源交叉验证与信度评分)、虚构工业手册上下文理解(展现规则遵循能力)、世界杯赛程网页 Agent 任务(展现工具调用与环境适应能力)。测试结果表明 Hy3 preview 在日常使用水准上不输主流模型,但存在思维链表演感、信度评分伪精确、工具调用效率不极致等问题。文章核心观点是 Hy3 preview 的意义不在于成为最强模型,而在于为腾讯的 AI 产品补齐基座短板,使其不再依赖第三方模型。

💡 主要观点

- Hy3 preview 是腾讯混元团队重组后,由姚顺雨主导的首个重要模型发布。 该模型采用 295B 总参数、21B 激活参数的 MoE 架构,定位解决真实世界复杂工程问题,标志着腾讯在基座模型能力上的关键补强。

实测表明 Hy3 preview 在代码生成、信息核实、上下文理解和 Agent 能力上达到主流水平。 四项测试覆盖了审美判断、多信源交叉验证、规则遵循和环境适应等能力,模型表现不输当前主流模型,尤其在上下文学习测试中未犯常见错误。
Hy3 preview 的核心价值在于补齐腾讯基座模型短板,而非追求能力超越。 文章认为腾讯 AI 产品此前受限于底层模型能力,Hy3 preview 让产品团队有底气使用自家基座,为后续更大尺寸模型和产品协同奠定基础。

💬 文章金句

- Hy3 preview 并不是当前最强的模型,但此前腾讯真正的问题是没有一个够用的基座,能撑起自己的产品线,同时在模型能力上回到牌桌上。

  • Hy3 preview 在此刻的'任务'也许就在这里:不是要做最强的模型,而是让腾讯的 AI 产品终于有底气只用自家的基座。
  • 产品层能弥补的差距是有限的。腾讯在 AI 这场仗里,产品腿和模型腿的长度一直不一样。

📊 文章信息

AI 初评:82

来源:硅星人Pro

作者:硅星人Pro

分类:人工智能

语言:中文

阅读时间:12 分钟

字数:2942

标签: 腾讯, Hy3 preview, 混元大模型, 姚顺雨, 模型评测

阅读完整文章

查看原文 → 發佈: 2026-04-24 08:42:00 收錄: 2026-04-24 14:00:45

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。