本文介绍了快手在 WWW 2026 发表的 GRank 框架,通过“生成-重排”解耦设计及辅助增强模块,在训练阶段赋予双塔模型目标感知能力,从而在保持在线高效检索的同时,显著提升了召回精度。
📝 详细摘要
文章详细阐述了快手技术团队为解决工业级推荐系统中召回阶段效率与精度的固有矛盾而提出的 GRank 框架。该框架将“剪枝”(快速检索)与“打分”(精准评估)两个任务解耦,设计了 Generator(生成器)、Ranker(排序器)和仅在训练时出现的 Auxiliary(辅助器)三个模块。核心创新在于,通过 Auxiliary 模块的参数共享和梯度反向传播,让 Generator 在训练阶段就能学习 Ranker 的“眼光”,从而在推理时(Auxiliary 消失)依然能高效产出更符合精排期望的候选集。文章还介绍了为应对训练算力挑战而提出的 DCSA 优化方法,并展示了 GRank 在离线和线上实验中取得的显著效果提升(如 Recall@500 相比双塔提升超 100%)。最后,文章附带了团队介绍和招聘信息。
💡 主要观点
- GRank 通过“生成-重排”解耦架构,从根本上分离了检索效率与建模精度的优化目标。 Generator 负责高效向量检索(快),Ranker 负责小范围精准交叉注意力打分(准),避免了传统树/图索引中两者耦合带来的维护成本和延迟问题。
💬 文章金句
- GRank 尝试将“剪枝”与“打分”职能进行显式解耦:第一阶段(生成/剪枝)只管“快速找出可能感兴趣的候选”;第二阶段(排序/打分)只管“精准判断这些候选好不好”。
- 通过 Auxiliary,GRank 成功将“目标感知”的能力,从推理时的结构设计,转移到了训练时的目标优化中。
- 这种设计确保了第一阶段圈选出的候选集,在分布上趋同于第二阶段的高分期望。
- 训练态:完整的 GRank 框架同时利用 CA 进行全局建模,利用 SA 捕捉细粒度的序列依赖,并驱动共享稀疏表示的更新。推理态:关键在于“静默屏蔽 Auxiliary”。
- GRank 的核心贡献在于通过架构上的解耦与协同训练,缓解了工业级检索系统中长期存在的效率与精度博弈。
📊 文章信息
AI 初评:89
来源:快手技术
作者:快手技术
分类:人工智能
语言:中文
阅读时间:25 分钟
字数:6115
标签: 推荐系统, 召回模型, 双塔模型, GRank, 目标感知