📡 Poller 最後抓取: 51 分鐘前 (06-09 00:00)
BestBlogs 精選 (21638)
🏷️ 熱門標籤
● 【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (2)--- On-Policy Distillation
📅 2026-05-27 20:53 (12 天前) 罗西的思考 人工智能 2 分鐘 ★ 87
● 系统聊聊 On-Policy Distillation 的原理
📅 2026-04-27 16:14 (04-27 16:14) AINLP 人工智能 2 分鐘 ★ 86
● 影响 OPD work 的因素有哪些?聊聊 Rethinking OPD 这一路
📅 2026-04-25 00:00 (04-25 00:00) 青稞AI 人工智能 2 分鐘 ★ 87
● Rethinking On-Policy Distillation of Large Language Models: 现象、机制与配方
📅 2026-04-17 12:30 (04-17 12:30) 青稞AI 人工智能 2 分鐘 ★ 89