ACL 2026 | RouteMoA：无需预推理的动态路由，实现高效多智能体混合

📌 一句话摘要

RouteMoA 提出了一种无需预推理的动态路由方法，通过先验预测和后验修正，在推理前筛选模型，大幅降低多智能体混合系统的计算成本和延迟。

📝 详细摘要

本文介绍了被 ACL 2026 接收的论文 RouteMoA，该研究由上海交通大学、腾讯、上海人工智能实验室等机构合作完成。RouteMoA 的核心创新在于将多智能体混合（MoA）系统中的模型选择从「后验判断」转变为「先验预测 + 轻量修正」。传统 MoA 方法需要所有模型先进行推理，再筛选融合，导致计算成本高昂。RouteMoA 引入轻量级 scorer 根据用户 query 预测模型表现，将模型池缩小到潜力子集，再通过 self-assessment 和 cross-assessment 进行低成本修正，最终综合性能、成本和延迟进行排序。在包含 15 个模型的大规模实验中，RouteMoA 实现了成本降低 89.8%、延迟降低 63.6%，同时准确率有所提升。论文还发现，多模型系统的瓶颈正从「选谁来回答」转向「如何整合多个答案」。

💡 主要观点

- RouteMoA 将模型选择从后验判断前移到推理之前。 通过轻量级 scorer 根据用户 query 预测模型能力，避免对所有模型进行无效推理，从根本上降低计算成本。

先验筛选后，通过混合评审机制进行低成本修正。 引入 self-assessment 和 cross-assessment，仅基于已生成的输出进行纠错，不引入额外推理调用，确保筛选准确性。

在 15 个模型的大规模实验中，成本降低 89.8%，延迟降低 63.6%。 减少无效计算不仅没有伤害性能，反而通过聚焦于更合适的模型，整体准确率相对传统 MoA 和 Sparse MoA 有所提升。

多模型系统的瓶颈正在从模型选择转向答案融合。 失败案例分析显示，超过 50% 的错误来自最终答案融合阶段的 aggregation drift，而非选错模型，提示未来研究应更多关注融合机制。

💬 文章金句

- RouteMoA 的核心思想是，通过在推理前进行模型能力预测，避免对所有模型进行无效推理。

减少无效计算，不仅不会伤害性能，反而会让系统更专注于对的模型。
多模型系统的本质是稀疏的。
多模型系统的瓶颈正在发生转移：从 '选谁来回答'，转向 '如何整合多个答案'。
随着多模型协作的兴起，系统层的调度与协同，正变得与模型能力同样重要。

📊 文章信息

AI 初评：88

来源：机器之心

作者：机器之心

分类：人工智能

语言：中文

阅读时间：9 分钟

字数：2047

标签： RouteMoA, Mixture-of-Agents, 动态路由, 多智能体系统, ACL 2026

阅读完整文章

ACL 2026 | RouteMoA：无需预推理的动态路由，实现高效多智能体混合

🤖 問 AI