腾讯混元开源 Hy-MT2 翻译模型家族,提供 1.8B、7B、30B-A3B 三个尺寸,覆盖 33 种语言,在通用和专业翻译任务上达到开源 SoTA,并支持 1.25-bit 极端量化部署。
📝 详细摘要
腾讯混元于 5 月 21 日宣布开源全新翻译模型 Hy-MT2,并同步上线翻译小程序「腾讯 Hy 翻译」。Hy-MT2 是一个支持 33 种语言互译的多语言模型家族,包含三个尺寸:Hy-MT2-1.8B(端侧轻量)、Hy-MT2-7B(均衡实力)和 Hy-MT2-30B-A3B(专业效果)。其中,7B 和 30B-A3B 模型在各类翻译任务上达到了开源模型 SoTA,超越了参数规模大几十倍的模型;轻量级的 1.8B 模型也超越了微软等主流商业 API。模型在通用翻译能力上接近 Gemini 3.1 Pro,在金融、政治、教育等垂直领域表现更优。Hy-MT2 的最大提升在于指令遵循能力,能准确理解用户关于术语、风格和输出格式的要求。此外,基于混元自研的 Sherry 框架,模型提供了 1.25-bit 极端量化版本,在苹果 A15 芯片上推理速度相比前代提升 1.5 倍,仅需 440MB 存储空间,可部署在主流手机芯片上。模型已在 GitHub、Huggingface 和 ModelScope 等平台开源。
💡 主要观点
- Hy-MT2 系列在通用和专业翻译任务上达到开源模型 SoTA。 7B 和 30B-A3B 模型在 FLORES-200 等基准测试中超越了几十倍参数量的开源模型,并在金融、政治、教育等垂直领域部分超越主流商业翻译模型。
💬 文章金句
- Hy-MT2 是支持 33 种语言互译的多语言模型,其中 7B 和 30B-A3B 模型在各类翻译任务上达到了开源模型 SoTA,超越了几十倍参数量的模型。
- Hy-MT2-30B-A3B 效果已经超过 Gemini 3.1 Pro,特别在垂直领域的测试集中,Hy-MT2-30B-A3B 在金融、政治、教育几个领域的翻译效果已经部分超过主流翻译模型。
- 基于混元自研 Sherry 框架实现的 1.25-bit 极低比特量化版本在苹果 A15 上的推理速度相比 Hy-MT1.5 的 4-bit 量化版本提升了 1.5 倍。
📊 文章信息
AI 初评:86
来源:魔搭ModelScope社区
作者:魔搭ModelScope社区
分类:人工智能
语言:中文
阅读时间:6 分钟
字数:1487
标签: 腾讯混元, Hy-MT2, 机器翻译, 开源模型, 多语言模型