← 回總覽

今日开源(2026-5-22):腾讯混元 Hy-MT2 正式开源,快思考多语言翻译模型系列,1.8B/7B/30B-A3B 三尺寸覆盖 33 种语言互译

📅 2026-05-22 18:39 机器之心SOTA模型 人工智能 2 分鐘 1428 字 評分: 80
开源项目 多语言翻译 AI Agent 视觉推理 数字人
📌 一句话摘要 今日开源项目汇总:腾讯混元发布多语言翻译模型 Hy-MT2 系列,另有视觉语言动作模型、AI Agent 治理工具包等多个项目开源。 📝 详细摘要 本文是机器之心 SOTA 模型频道发布的每日开源项目汇总,涵盖 7 个开源项目。重点包括:腾讯混元推出的 Hy-MT2 多语言翻译模型系列,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译,1.8B 版本支持端侧部署;CVPR 2026 收录的视觉语言动作模型 HiF-VLA;基于 Gemma 4 微调的角色扮演模型 Equinox-31B;美团开源的音频驱动数字人视频生成框架 LongCat-Video-

📌 一句话摘要

今日开源项目汇总:腾讯混元发布多语言翻译模型 Hy-MT2 系列,另有视觉语言动作模型、AI Agent 治理工具包等多个项目开源。

📝 详细摘要

本文是机器之心 SOTA 模型频道发布的每日开源项目汇总,涵盖 7 个开源项目。重点包括:腾讯混元推出的 Hy-MT2 多语言翻译模型系列,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译,1.8B 版本支持端侧部署;CVPR 2026 收录的视觉语言动作模型 HiF-VLA;基于 Gemma 4 微调的角色扮演模型 Equinox-31B;美团开源的音频驱动数字人视频生成框架 LongCat-Video-Avatar-1.5;微软推出的 AI Agent 治理工具包;视觉推理研究项目 ATLAS;以及面向 ASR 的公开数据集 Voices-in-the-Wild。文章以项目简介和链接为主,未提供深度技术分析。

💡 主要观点

- 腾讯混元开源 Hy-MT2 多语言翻译模型系列,支持 33 种语言互译。 Hy-MT2 提供 1.8B、7B、30B-A3B 三个尺寸,1.8B 版本支持 1.25-bit 极致量化适配端侧部署,整体性能优于多个主流开源模型及商用 API,并同步开源翻译指令遵循能力测评基准 IFMTBench。

微软开源 AI Agent 治理工具包,覆盖 10 项 OWASP Agentic Top 10 风险。 该工具包提供策略强制、零信任身份、执行沙箱、可靠性工程等能力,支持多语言与 20+ 主流 Agent 开发框架,可实现亚毫秒级策略校验与审计。
美团开源 LongCat-Video-Avatar-1.5,实现商用级数字人视频合成。 该框架基于 LongCat-Video 基础模型,支持音频文本转视频、音图文转视频、视频续生成等任务,兼容单/多流音频输入。

💬 文章金句

- Hy-MT2 是腾讯混元推出的「快思考」多语言翻译模型系列,包含 1.8B、7B、30B-A3B(MoE)三个尺寸,支持 33 种语言互译。

  • 微软推出的 AI Agent 治理工具包,提供策略强制、零信任身份、执行沙箱、可靠性工程等能力,覆盖全部 10 项 OWASP Agentic Top 10 风险。
  • ATLAS 是视觉推理方向的研究项目,采用单离散词方案实现视觉推理,性能超越现有 Agent 类和隐式类视觉推理方法。

📊 文章信息

AI 初评:80

来源:机器之心SOTA模型

作者:机器之心SOTA模型

分类:人工智能

语言:中文

阅读时间:5 分钟

字数:1140

标签: 开源项目, 多语言翻译, AI Agent, 视觉推理, 数字人

阅读完整文章

查看原文 → 發佈: 2026-05-22 18:39:00 收錄: 2026-05-22 22:00:45

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。