腾讯混元团队在重建预训练与强化学习基础设施后,发布了首个模型 Hy3 Preview,该模型采用 MoE 架构,强调能力体系化、评测真实性和性价比,在推理、长文和代码智能体方面有显著提升。
📝 详细摘要
该推文详细介绍了腾讯混元团队发布的新模型 Hy3 Preview。这是团队在重建预训练与强化学习基础设施后的首个模型,标志着从「追榜」逻辑向实用主义的系统转型。模型采用 MoE 架构,总参数 295B / 激活参数 21B,支持 256K 上下文,并采用快慢思考融合机制。文章重点阐述了三大核心原则:能力体系化、评测真实性和性价比追求。在能力表现上,Hy3 在复杂推理、上下文学习与指令遵循方面进入第一梯队,但在顶尖数学推理上仍有差距;代码与智能体能力提升最为显著。此外,模型在非结构化信息的隐性挖掘能力上表现突出,能处理口语化、多轮穿插的对话并生成结构化的排期表格。推文引用了官方博客和相关信息卡。
📊 文章信息
AI 初评:88
来源:meng shao(@shao__meng)
作者:meng shao
分类:人工智能
语言:中文
阅读时间:6 分钟
字数:1466
标签: 腾讯混元, Hy3 Preview, MoE, 大模型, 实用主义