WWW 2026｜让双塔“开天眼”：快手 GRank 赋予生成器“预判”能力，在线召回快准兼得

📌 一句话摘要

本文介绍了快手在 WWW 2026 发表的 GRank 框架，通过“生成-重排”解耦设计及辅助增强模块，在训练阶段赋予双塔模型目标感知能力，从而在保持在线高效检索的同时，显著提升了召回精度。

📝 详细摘要

文章详细阐述了快手技术团队为解决工业级推荐系统中召回阶段效率与精度的固有矛盾而提出的 GRank 框架。该框架将“剪枝”（快速检索）与“打分”（精准评估）两个任务解耦，设计了 Generator（生成器）、Ranker（排序器）和仅在训练时出现的 Auxiliary（辅助器）三个模块。核心创新在于，通过 Auxiliary 模块的参数共享和梯度反向传播，让 Generator 在训练阶段就能学习 Ranker 的“眼光”，从而在推理时（Auxiliary 消失）依然能高效产出更符合精排期望的候选集。文章还介绍了为应对训练算力挑战而提出的 DCSA 优化方法，并展示了 GRank 在离线和线上实验中取得的显著效果提升（如 Recall@500 相比双塔提升超 100%）。最后，文章附带了团队介绍和招聘信息。

💡 主要观点

- GRank 通过“生成-重排”解耦架构，从根本上分离了检索效率与建模精度的优化目标。 Generator 负责高效向量检索（快），Ranker 负责小范围精准交叉注意力打分（准），避免了传统树/图索引中两者耦合带来的维护成本和延迟问题。

Auxiliary 模块是实现“训练态协同、推理态解耦”的关键，赋予生成器“预判”能力。 在训练时，Auxiliary 让 Generator 与候选物品交互，通过共享参数和 InfoNCE 损失，将 Ranker 的目标感知能力反向注入 Generator 的表征空间，使其产出的用户向量隐含了精排偏好。

提出的 DCSA 优化方法，有效解决了训练时因引入 Auxiliary 而带来的 O(N²) 计算复杂度问题。 通过分解因果自注意力矩阵，规避冗余计算，将 Auxiliary 模块的计算量降低至原始方案的 17.8%，为大规模工业化训练扫清了算力障碍。

GRank 在工业场景下实现了效率与精度的双重显著提升。 离线实验显示，其 Recall@500 相比最优基线（TDM）提升 30%，相比双塔模型提升超 100%；在线延迟可控（P99

💬 文章金句

- GRank 尝试将“剪枝”与“打分”职能进行显式解耦：第一阶段（生成/剪枝）只管“快速找出可能感兴趣的候选”；第二阶段（排序/打分）只管“精准判断这些候选好不好”。

通过 Auxiliary，GRank 成功将“目标感知”的能力，从推理时的结构设计，转移到了训练时的目标优化中。
这种设计确保了第一阶段圈选出的候选集，在分布上趋同于第二阶段的高分期望。
训练态：完整的 GRank 框架同时利用 CA 进行全局建模，利用 SA 捕捉细粒度的序列依赖，并驱动共享稀疏表示的更新。推理态：关键在于“静默屏蔽 Auxiliary”。
GRank 的核心贡献在于通过架构上的解耦与协同训练，缓解了工业级检索系统中长期存在的效率与精度博弈。

📊 文章信息

AI 初评：89

来源：快手技术

作者：快手技术

分类：人工智能

语言：中文

阅读时间：25 分钟

字数：6115

标签：推荐系统, 召回模型, 双塔模型, GRank, 目标感知

阅读完整文章

WWW 2026｜让双塔“开天眼”：快手 GRank 赋予生成器“预判”能力，在线召回快准兼得

🤖 問 AI