SuperPortia Reading
總覽
文章
簡報
🔍 搜尋
全部
未讀 (12252)
★ 收藏 (0)
🤖 人工智能 (7801)
📊 商业科技 (1922)
💻 软件编程 (1219)
📁 个人成长 (764)
🎨 产品设计 (214)
📁 生活文化 (131)
📁 媒体资讯 (80)
📁 投资财经 (77)
📁 AI 产品 (39)
📁 AI (5)
篩選中:
🏷️ On-Policy Distillation
共 1 篇
✕ 清除篩選
12254
全部文章
12252
未讀
124
今日新增
0
收藏
📡 Poller
最後抓取:
30 分鐘前
(04-18 22:00)
BestBlogs 精選 (12233)
🏷️ 熱門標籤
AI Agent
1371
AI 智能体
738
Claude Code
656
Anthropic
652
LLM
564
AI 编程
538
OpenClaw
502
开源
445
AI 安全
410
Claude
401
AI
398
OpenAI
371
软件工程
359
开发者工具
349
生产力
308
GitHub
254
自动化
241
AI 基础设施
229
AI 开发
226
MCP
225
●
Rethinking On-Policy Distillation of Large Language Models: 现象、机制与配方
📌 一句话摘要 本文系统性地分析了 On-Policy Distillation 的成功条件与失败机制,指出师生模型的思维模式一致性与教师提供增量知识是关键,并揭示了高概率 Token 对齐的微观动态,最后提出了 SFT 冷启动和 Prompt 对齐等实用策略。 📝 详细摘要 文章对近期热门的
📅 2026-04-17 12:30
(1 天前)
青稞AI
人工智能
2 分鐘
★ 89
On-Policy Distillation
知识蒸馏
大语言模型
训练动力学