腾讯混元开源全新翻译模型 Hy-MT2，三尺寸覆盖 33 语种翻译

📌 一句话摘要

腾讯混元开源 Hy-MT2 翻译模型家族，提供 1.8B、7B、30B-A3B 三个尺寸，覆盖 33 种语言，在通用和专业翻译任务上达到开源 SoTA，并支持 1.25-bit 极端量化部署。

📝 详细摘要

腾讯混元于 5 月 21 日宣布开源全新翻译模型 Hy-MT2，并同步上线翻译小程序「腾讯 Hy 翻译」。Hy-MT2 是一个支持 33 种语言互译的多语言模型家族，包含三个尺寸：Hy-MT2-1.8B（端侧轻量）、Hy-MT2-7B（均衡实力）和 Hy-MT2-30B-A3B（专业效果）。其中，7B 和 30B-A3B 模型在各类翻译任务上达到了开源模型 SoTA，超越了参数规模大几十倍的模型；轻量级的 1.8B 模型也超越了微软等主流商业 API。模型在通用翻译能力上接近 Gemini 3.1 Pro，在金融、政治、教育等垂直领域表现更优。Hy-MT2 的最大提升在于指令遵循能力，能准确理解用户关于术语、风格和输出格式的要求。此外，基于混元自研的 Sherry 框架，模型提供了 1.25-bit 极端量化版本，在苹果 A15 芯片上推理速度相比前代提升 1.5 倍，仅需 440MB 存储空间，可部署在主流手机芯片上。模型已在 GitHub、Huggingface 和 ModelScope 等平台开源。

💡 主要观点

- Hy-MT2 系列在通用和专业翻译任务上达到开源模型 SoTA。 7B 和 30B-A3B 模型在 FLORES-200 等基准测试中超越了几十倍参数量的开源模型，并在金融、政治、教育等垂直领域部分超越主流商业翻译模型。

指令遵循能力是 Hy-MT2 的核心升级。 模型能准确理解并执行用户关于术语、风格和输出格式的个性化要求，例如「翻译结果简洁精炼，每句不超过 15 个字」，这在自建数据集 IFMTBench 上得到了验证。

1.25-bit 极端量化方案使模型可部署在手机端。 基于 Sherry 框架的 1.25-bit 量化版本仅需 440MB 存储空间，在苹果 A15 上推理速度提升 1.5 倍，实现了高质量翻译模型的端侧本地推理。

💬 文章金句

- Hy-MT2 是支持 33 种语言互译的多语言模型，其中 7B 和 30B-A3B 模型在各类翻译任务上达到了开源模型 SoTA，超越了几十倍参数量的模型。

Hy-MT2-30B-A3B 效果已经超过 Gemini 3.1 Pro，特别在垂直领域的测试集中，Hy-MT2-30B-A3B 在金融、政治、教育几个领域的翻译效果已经部分超过主流翻译模型。
基于混元自研 Sherry 框架实现的 1.25-bit 极低比特量化版本在苹果 A15 上的推理速度相比 Hy-MT1.5 的 4-bit 量化版本提升了 1.5 倍。

📊 文章信息

AI 初评：86

来源：魔搭ModelScope社区

作者：魔搭ModelScope社区

分类：人工智能

语言：中文

阅读时间：6 分钟

字数：1487

标签：腾讯混元, Hy-MT2, 机器翻译, 开源模型, 多语言模型

阅读完整文章

腾讯混元开源全新翻译模型 Hy-MT2，三尺寸覆盖 33 语种翻译

🤖 問 AI