今日开源项目汇总:腾讯混元发布多语言翻译模型 Hy-MT2 系列,另有视觉语言动作模型、AI Agent 治理工具包等多个项目开源。
📝 详细摘要
本文是机器之心 SOTA 模型频道发布的每日开源项目汇总,涵盖 7 个开源项目。重点包括:腾讯混元推出的 Hy-MT2 多语言翻译模型系列,提供 1.8B、7B、30B-A3B 三个尺寸,支持 33 种语言互译,1.8B 版本支持端侧部署;CVPR 2026 收录的视觉语言动作模型 HiF-VLA;基于 Gemma 4 微调的角色扮演模型 Equinox-31B;美团开源的音频驱动数字人视频生成框架 LongCat-Video-Avatar-1.5;微软推出的 AI Agent 治理工具包;视觉推理研究项目 ATLAS;以及面向 ASR 的公开数据集 Voices-in-the-Wild。文章以项目简介和链接为主,未提供深度技术分析。
💡 主要观点
- 腾讯混元开源 Hy-MT2 多语言翻译模型系列,支持 33 种语言互译。 Hy-MT2 提供 1.8B、7B、30B-A3B 三个尺寸,1.8B 版本支持 1.25-bit 极致量化适配端侧部署,整体性能优于多个主流开源模型及商用 API,并同步开源翻译指令遵循能力测评基准 IFMTBench。
💬 文章金句
- Hy-MT2 是腾讯混元推出的「快思考」多语言翻译模型系列,包含 1.8B、7B、30B-A3B(MoE)三个尺寸,支持 33 种语言互译。
- 微软推出的 AI Agent 治理工具包,提供策略强制、零信任身份、执行沙箱、可靠性工程等能力,覆盖全部 10 项 OWASP Agentic Top 10 风险。
- ATLAS 是视觉推理方向的研究项目,采用单离散词方案实现视觉推理,性能超越现有 Agent 类和隐式类视觉推理方法。
📊 文章信息
AI 初评:80
来源:机器之心SOTA模型
作者:机器之心SOTA模型
分类:人工智能
语言:中文
阅读时间:5 分钟
字数:1140
标签: 开源项目, 多语言翻译, AI Agent, 视觉推理, 数字人