腾讯混元开源全新翻译模型 Hy-MT2,包含 1.8B、7B 和 30B-A3B 三个尺寸,在多项翻译任务上达到开源最佳效果,并同步上线了基于该模型的「腾讯 Hy 翻译」小程序,支持离线翻译和自定义翻译风格。
📝 详细摘要
腾讯混元于 5 月 21 日宣布开源新一代翻译模型 Hy-MT2,并同步推出翻译小程序「腾讯 Hy 翻译」。Hy-MT2 是一个支持 33 种语言互译的多语言模型家族,包含三个尺寸:轻量级端侧部署的 1.8B、均衡实力的 7B 和专业效果的 30B-A3B。在 FLORES-200 等通用翻译评测中,Hy-MT2 系列模型达到了开源模型最佳效果,其中 7B 和 30B-A3B 模型超越了几十倍参数量的模型,1.8B 模型也超越了微软等主流商业 API。模型在金融、政治、教育等垂直领域也表现出色,其指令遵循能力是相比上一版本的最大提升,能够准确理解用户关于术语、风格和输出格式的要求。此外,Hy-MT2 探索了极低比特量化方案,基于混元自研 Sherry 框架实现的 1.25-bit 量化版本仅需 440MB 存储空间,可在苹果 A15 等主流手机芯片上实现本地推理,推理速度相比上一代提升 1.5 倍。基于该模型打造的「腾讯 Hy 翻译」小程序支持语音输入、自定义翻译风格和离线翻译,解决了网络受限场景下的翻译需求。
💡 主要观点
- Hy-MT2 在通用和专业翻译任务上均达到开源模型最佳效果。 在 FLORES-200 等通用翻译评测中,Hy-MT2-7B 和 30B-A3B 超越了几十倍参数量的模型,并在金融、政治、教育等垂直领域表现优异,部分场景超过主流翻译模型。
💬 文章金句
- Hy-MT2 是支持 33 种语言互译的多语言模型,其中 7B 和 30B-A3B 模型在各类翻译任务上达到了开源模型最佳效果,超越了几十倍参数量的模型。
- 相比上一版本模型,Hy-MT2 的最大提升体现在指令遵循能力上,模型能够更准确地理解并执行用户关于术语、风格和输出格式等方面的具体要求。
- 轻量级的 1.8B 模型也超越了微软等主流商业 API,且得益于 AngelSlim 1.25-bit 极端量化,仅需 440MB 存储空间,可以轻松部署在主流手机芯片上支持本地推理。
📊 文章信息
AI 初评:86
来源:量子位
作者:闻乐
分类:人工智能
语言:中文
阅读时间:7 分钟
字数:1571
标签: 腾讯混元, Hy-MT2, 机器翻译, 开源模型, 多语言模型