← 回總覽

Bengio 新论文刷新递归推理上限,并行轨迹碾压串行推理

📅 2026-05-23 21:58 机器之心 人工智能 2 分鐘 1634 字 評分: 88
GRAM 递归推理 概率模型 并行推理 Yoshua Bengio
📌 一句话摘要 Bengio 团队提出 GRAM 模型,将递归推理从确定性单轨变为概率性多轨,通过并行采样在 16 步递归+20 条轨迹下超越 320 步串行推理,为推理效率与质量提供了新范式。 📝 详细摘要 本文介绍了图灵奖得主 Yoshua Bengio 团队提出的 GRAM(生成式递归推理模型)框架。GRAM 的核心创新在于将传统递归推理模型(RRMs)的确定性潜在状态转移改造为概率性过程:在每一步递归中,模型从状态相关的高斯分布中采样随机引导信号,与确定性更新相加,从而生成多样化的推理轨迹。这种设计使模型能够探索解空间中的多个有效解,避免陷入局部最优。GRAM 采用层次化架构,将随

📌 一句话摘要

Bengio 团队提出 GRAM 模型,将递归推理从确定性单轨变为概率性多轨,通过并行采样在 16 步递归+20 条轨迹下超越 320 步串行推理,为推理效率与质量提供了新范式。

📝 详细摘要

本文介绍了图灵奖得主 Yoshua Bengio 团队提出的 GRAM(生成式递归推理模型)框架。GRAM 的核心创新在于将传统递归推理模型(RRMs)的确定性潜在状态转移改造为概率性过程:在每一步递归中,模型从状态相关的高斯分布中采样随机引导信号,与确定性更新相加,从而生成多样化的推理轨迹。这种设计使模型能够探索解空间中的多个有效解,避免陷入局部最优。GRAM 采用层次化架构,将随机性注入高层抽象状态,低层则进行细粒度快速更新。训练通过变分推断进行,后验能「看到」正确答案以学习有效探索策略。在推理时,GRAM 支持双轴扩展:深度扩展(增加递归步数)和宽度扩展(并行采样多条轨迹),后者可绕过延迟瓶颈。实验结果显示,GRAM 在 Sudoku-Extreme 上以 16 步递归+20 条并行采样达到 97.0% 准确率,超越 TRM 在 320 步串行递归时的 90.5%;在多解任务(N-Queens、Graph Coloring)上同时实现了最高准确率和接近最优的覆盖率;在无条件生成任务上也表现出色。消融实验表明,随机性与学习到的引导方向缺一不可。

💡 主要观点

- GRAM 将确定性递归推理改造为概率性多轨迹计算,通过随机采样探索解空间。 在每一步递归中,模型从状态相关的高斯分布中采样随机引导信号,与确定性更新结合,生成多样化推理轨迹,避免陷入局部最优,支持多解探索。

GRAM 提出双轴推理扩展策略:深度扩展与宽度扩展协同作用。 深度扩展增加递归步数,宽度扩展并行采样多条独立轨迹,通过多数投票或潜在过程奖励模型选择最佳结果。并行采样可绕过深度扩展的延迟瓶颈,在相同壁钟时间内覆盖更大解空间。
GRAM 在结构化推理、多解约束满足和无条件生成任务上全面超越确定性基线。 在 Sudoku-Extreme 上,GRAM 以 16 步递归+20 条并行采样达到 97.0% 准确率,超越 TRM 在 320 步串行递归时的 90.5%。在多解任务上,GRAM 同时实现最高准确率和接近最优的覆盖率。
随机性与学习到的引导方向协同作用,缺一不可。 消融实验显示,去掉引导方向或随机性均会导致性能显著下降,说明 GRAM 的增益来自变分框架下两者的协同,而非简单的随机扰动。

💬 文章金句

- GRAM 在仅用 16 步递归 + 20 条并行采样的情况下,就超越了所有确定性基线在 320 步串行递归时的表现。

  • 推理系统不仅需要「深」,还需要「宽」。
  • 在潜在空间中,通过概率递归,同时沿深度和宽度两个方向扩展。
  • GRAM 的增益来自变分框架本身,来自随机性与学习到的引导方向的协同作用,而非简单的随机扰动。

📊 文章信息

AI 初评:88

来源:机器之心

作者:机器之心

分类:人工智能

语言:中文

阅读时间:15 分钟

字数:3509

标签: GRAM, 递归推理, 概率模型, 并行推理, Yoshua Bengio

阅读完整文章

查看原文 → 發佈: 2026-05-23 21:58:00 收錄: 2026-05-24 18:00:44

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。