📡 Poller 最後抓取: 16 分鐘前 (06-08 20:00)
BestBlogs 精選 (21582)
🏷️ 熱門標籤
● 【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (2)--- On-Policy Distillation
📅 2026-05-27 20:53 (11 天前) 罗西的思考 人工智能 2 分鐘 ★ 87
● OPD 深度解析:从数学推导到 DeepSeekV4、SWIFT 与 verl 实践
● TPAMI 2026 | GNN 潜力真的释放了吗?BiKT 让 MLP 反向补课
● VLA 大模型部署的成本被同济 ActDistill 打下来了!
● 张雪峰被蒸馏,打工人被「永生」
● 系统聊聊 On-Policy Distillation 的原理
📅 2026-04-27 16:14 (04-27 16:14) AINLP 人工智能 2 分鐘 ★ 86
● 影响 OPD work 的因素有哪些?聊聊 Rethinking OPD 这一路
📅 2026-04-25 00:00 (04-25 00:00) 青稞AI 人工智能 2 分鐘 ★ 87
● 苹果研究:通过线性化注意力中间体实现 Transformer 到 Mamba SSM 的跨架构蒸馏
📅 2026-04-20 07:23 (04-20 07:23) Berryxia.AI 人工智能 1 分鐘 ★ 79
● 开源「仓颉.Skill」,你现在可以蒸馏任何书!
● Rethinking On-Policy Distillation of Large Language Models: 现象、机制与配方
📅 2026-04-17 12:30 (04-17 12:30) 青稞AI 人工智能 2 分鐘 ★ 89
● 用强化学习做知识蒸馏,方差太大怎么办?
● NanoVDR:将 2B 视觉语言模型蒸馏为 70M 纯文本编码器