RouteMoA 提出了一种无需预推理的动态路由方法,通过先验预测和后验修正,在推理前筛选模型,大幅降低多智能体混合系统的计算成本和延迟。
📝 详细摘要
本文介绍了被 ACL 2026 接收的论文 RouteMoA,该研究由上海交通大学、腾讯、上海人工智能实验室等机构合作完成。RouteMoA 的核心创新在于将多智能体混合(MoA)系统中的模型选择从「后验判断」转变为「先验预测 + 轻量修正」。传统 MoA 方法需要所有模型先进行推理,再筛选融合,导致计算成本高昂。RouteMoA 引入轻量级 scorer 根据用户 query 预测模型表现,将模型池缩小到潜力子集,再通过 self-assessment 和 cross-assessment 进行低成本修正,最终综合性能、成本和延迟进行排序。在包含 15 个模型的大规模实验中,RouteMoA 实现了成本降低 89.8%、延迟降低 63.6%,同时准确率有所提升。论文还发现,多模型系统的瓶颈正从「选谁来回答」转向「如何整合多个答案」。
💡 主要观点
- RouteMoA 将模型选择从后验判断前移到推理之前。 通过轻量级 scorer 根据用户 query 预测模型能力,避免对所有模型进行无效推理,从根本上降低计算成本。
💬 文章金句
- RouteMoA 的核心思想是,通过在推理前进行模型能力预测,避免对所有模型进行无效推理。
- 减少无效计算,不仅不会伤害性能,反而会让系统更专注于对的模型。
- 多模型系统的本质是稀疏的。
- 多模型系统的瓶颈正在发生转移:从 '选谁来回答',转向 '如何整合多个答案'。
- 随着多模型协作的兴起,系统层的调度与协同,正变得与模型能力同样重要。
📊 文章信息
AI 初评:88
来源:机器之心
作者:机器之心
分类:人工智能
语言:中文
阅读时间:9 分钟
字数:2047
标签: RouteMoA, Mixture-of-Agents, 动态路由, 多智能体系统, ACL 2026