腾讯混元团队发布 295B MoE 巨型模型 HY3 Preview,支持 256k 长上下文及快慢思考双模式。
📝 详细摘要
腾讯混元团队在首席科学家姚顺雨带领下,发布了重建后的 HY3 Preview 模型。该模型采用 295B MoE 架构(21B 激活参数),支持 256k 超长上下文,并引入了类似 OpenAI o1 的快慢思考(Hybrid fast/slow thinking)模式。在 AI 搜索和 Agent 表现上进行了深度优化,目前已在 Hugging Face 开放模型集合与 Demo。
📊 文章信息
AI 初评:87
来源:Berryxia.AI(@berryxia)
作者:Berryxia.AI
分类:人工智能
语言:中文
阅读时间:2 分钟
字数:307
标签: 腾讯混元, HY3, MoE, 长上下文, AI搜索