腾讯混元开源了极致量化的手机端离线翻译模型 Hy-MT1.5-1.8B,通过 2-bit 和 1.25-bit 压缩技术将模型体积降至 440MB,支持 33 种语言离线翻译,翻译质量优于谷歌翻译。
📝 详细摘要
本文介绍了腾讯混元团队于 4 月 29 日开源的手机端离线翻译模型 Hy-MT1.5-1.8B 的极致量化版本。该模型基于 1.8B 参数的 Hy-MT1.5 专业翻译大模型打造,原生支持 33 种语言和 1056 个翻译方向。为解决模型在手机上部署的内存和速度问题,团队推出了两种量化方案:2-bit 模型(574MB)采用拉伸弹性量化(SEQ)实现几乎无损的翻译质量;1.25-bit 模型(440MB)基于被 ACL 2026 录用的 Sherry 稀疏高效三值量化技术,通过细粒度稀疏策略将每 4 个参数中的 3 个用 1-bit 储存、1 个用 0 储存。配合专为手机 CPU 设计的 STQ 内核,模型可在骁龙 865/888 等中低端设备上流畅运行。文章强调该方案完全离线、无需联网、不涉及隐私泄露,并提供了模型权重、Demo APK 及技术报告的开源链接。
💡 主要观点
- 腾讯混元开源了极致量化的手机端离线翻译模型,体积仅 440MB。 基于 1.8B 参数的 Hy-MT1.5 模型,通过 2-bit 和 1.25-bit 量化压缩技术,将模型从 3.3GB 压缩至 440MB,可在手机本地运行,无需联网。
💬 文章金句
- 腾讯混元推出极致量化压缩版本翻译模型 Hy-MT1.5-1.8B-1.25bit,把支持 33 种语言的翻译大模型压缩至 440MB,无需联网,下载即可直接在手机本地运行,翻译质量优于谷歌翻译。
- Sherry 压缩方案的核心逻辑在于'细粒度稀疏'策略:每 4 个模型参数,3 个最重要的用 1-bit 储存,1 个用 0 储存,平均每个参数仅需 1.25-bit。
- 无需网络,无需订阅,完全本地处理、不涉及个人信息的采集和上传,一次下载永久使用!
📊 文章信息
AI 初评:86
来源:腾讯混元
作者:腾讯混元
分类:人工智能
语言:中文
阅读时间:11 分钟
字数:2590
标签: 腾讯混元, Hy-MT1.5, 离线翻译, 模型量化, Sherry