全部 未讀 (12252) ★ 收藏 (0) 🤖 人工智能 (7801) 📊 商业科技 (1922) 💻 软件编程 (1219) 📁 个人成长 (764) 🎨 产品设计 (214) 📁 生活文化 (131) 📁 媒体资讯 (80) 📁 投资财经 (77) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 训练动力学 共 1 篇 ✕ 清除篩選
12254
全部文章
12252
未讀
124
今日新增
0
收藏
📡 Poller 最後抓取: 40 分鐘前 (04-18 22:00)
BestBlogs 精選 (12233)

🏷️ 熱門標籤

AI Agent 1371 AI 智能体 738 Claude Code 656 Anthropic 652 LLM 564 AI 编程 538 OpenClaw 502 开源 445 AI 安全 410 Claude 401 AI 398 OpenAI 371 软件工程 359 开发者工具 349 生产力 308 GitHub 254 自动化 241 AI 基础设施 229 AI 开发 226 MCP 225
Rethinking On-Policy Distillation of Large Language Models: 现象、机制与配方
📌 一句话摘要 本文系统性地分析了 On-Policy Distillation 的成功条件与失败机制,指出师生模型的思维模式一致性与教师提供增量知识是关键,并揭示了高概率 Token 对齐的微观动态,最后提出了 SFT 冷启动和 Prompt 对齐等实用策略。 📝 详细摘要 文章对近期热门的
📅 2026-04-17 12:30 (1 天前) 青稞AI 人工智能 2 分鐘 ★ 89
On-Policy Distillation 知识蒸馏 大语言模型 训练动力学