← 回總覽

出国必备+1!腾讯混元开源手机端离线翻译模型,仅 0.4G,支持 33 种语言

📅 2026-04-29 16:30 腾讯混元 人工智能 2 分鐘 1587 字 評分: 86
腾讯混元 Hy-MT1.5 离线翻译 模型量化 Sherry
📌 一句话摘要 腾讯混元开源了极致量化的手机端离线翻译模型 Hy-MT1.5-1.8B,通过 2-bit 和 1.25-bit 压缩技术将模型体积降至 440MB,支持 33 种语言离线翻译,翻译质量优于谷歌翻译。 📝 详细摘要 本文介绍了腾讯混元团队于 4 月 29 日开源的手机端离线翻译模型 Hy-MT1.5-1.8B 的极致量化版本。该模型基于 1.8B 参数的 Hy-MT1.5 专业翻译大模型打造,原生支持 33 种语言和 1056 个翻译方向。为解决模型在手机上部署的内存和速度问题,团队推出了两种量化方案:2-bit 模型(574MB)采用拉伸弹性量化(SEQ)实现几乎无损的翻译

📌 一句话摘要

腾讯混元开源了极致量化的手机端离线翻译模型 Hy-MT1.5-1.8B,通过 2-bit 和 1.25-bit 压缩技术将模型体积降至 440MB,支持 33 种语言离线翻译,翻译质量优于谷歌翻译。

📝 详细摘要

本文介绍了腾讯混元团队于 4 月 29 日开源的手机端离线翻译模型 Hy-MT1.5-1.8B 的极致量化版本。该模型基于 1.8B 参数的 Hy-MT1.5 专业翻译大模型打造,原生支持 33 种语言和 1056 个翻译方向。为解决模型在手机上部署的内存和速度问题,团队推出了两种量化方案:2-bit 模型(574MB)采用拉伸弹性量化(SEQ)实现几乎无损的翻译质量;1.25-bit 模型(440MB)基于被 ACL 2026 录用的 Sherry 稀疏高效三值量化技术,通过细粒度稀疏策略将每 4 个参数中的 3 个用 1-bit 储存、1 个用 0 储存。配合专为手机 CPU 设计的 STQ 内核,模型可在骁龙 865/888 等中低端设备上流畅运行。文章强调该方案完全离线、无需联网、不涉及隐私泄露,并提供了模型权重、Demo APK 及技术报告的开源链接。

💡 主要观点

- 腾讯混元开源了极致量化的手机端离线翻译模型,体积仅 440MB。 基于 1.8B 参数的 Hy-MT1.5 模型,通过 2-bit 和 1.25-bit 量化压缩技术,将模型从 3.3GB 压缩至 440MB,可在手机本地运行,无需联网。

1.25-bit 量化方案基于被 ACL 2026 录用的 Sherry 技术。 Sherry 采用细粒度稀疏策略,每 4 个参数中 3 个用 1-bit 储存、1 个用 0 储存,平均每个参数仅需 1.25-bit,配合专为手机 CPU 设计的 STQ 内核实现高效推理。
模型支持 33 种语言和 1056 个翻译方向,翻译质量优于谷歌翻译。 Hy-MT1.5 原生支持中英、法语、日语、阿拉伯语等常见语言及藏语、蒙古语等少数民族语言,在评测基准中翻译质量超越谷歌翻译等主流系统。
完全离线运行,保护用户隐私。 所有翻译处理均在手机本地完成,无需网络连接,不涉及个人信息的上传,解决了联网翻译在无信号场景下的痛点。

💬 文章金句

- 腾讯混元推出极致量化压缩版本翻译模型 Hy-MT1.5-1.8B-1.25bit,把支持 33 种语言的翻译大模型压缩至 440MB,无需联网,下载即可直接在手机本地运行,翻译质量优于谷歌翻译。

  • Sherry 压缩方案的核心逻辑在于'细粒度稀疏'策略:每 4 个模型参数,3 个最重要的用 1-bit 储存,1 个用 0 储存,平均每个参数仅需 1.25-bit。
  • 无需网络,无需订阅,完全本地处理、不涉及个人信息的采集和上传,一次下载永久使用!

📊 文章信息

AI 初评:86

来源:腾讯混元

作者:腾讯混元

分类:人工智能

语言:中文

阅读时间:11 分钟

字数:2590

标签: 腾讯混元, Hy-MT1.5, 离线翻译, 模型量化, Sherry

阅读完整文章

查看原文 → 發佈: 2026-04-29 16:30:00 收錄: 2026-04-29 22:00:45

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。