全部 未讀 (21689) ★ 收藏 (0) 🤖 人工智能 (11201) 📊 商业科技 (4470) 💻 软件编程 (1688) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (838) 📁 投资财经 (537) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 蒸馏 共 51 篇 ✕ 清除篩選
21691
全部文章
21689
未讀
53
今日新增
0
收藏
📡 Poller 最後抓取: 43 分鐘前 (06-09 02:00)
BestBlogs 精選 (21656)

🏷️ 熱門標籤

AI Agent 2173 AI 编程 994 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 689 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 492 开发者工具 433 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
谷歌四大巨头齐聚:蒸馏模型的精髓是“挤柠檬”!Gemini 将用自己写的代码“改进”自己!五年后的谷歌可能只有一款产品
📌 一句话摘要 Google DeepMind 四位核心人物(Jeff Dean、Noam Shazeer、Oriol Vinyals、Koray Kavukcuoglu)深度对谈,揭秘 Gemini 3.5 Flash 研发幕后、模型蒸馏的“挤柠檬”精髓、Omni 作为世界模型的定位,并预测五年
📅 2026-05-30 18:09 (9 天前) 51CTO技术栈 人工智能 2 分鐘 ★ 86
Gemini 3.5 Google DeepMind 模型蒸馏 世界模型
【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (2)--- On-Policy Distillation
📌 一句话摘要 本文深入剖析了 OpenClaw-RL 框架中的 On-Policy Distillation (OPD) 机制,详细阐述了其原理、数学形式、与 PPO/DPO/KD 的区别,以及 Hindsight-Guided OPD 的具体实现。 📝 详细摘要 本文是 OpenClaw-R
📅 2026-05-27 20:53 (12 天前) 罗西的思考 人工智能 2 分鐘 ★ 87
强化学习 On-Policy Distillation OpenClaw-RL 知识蒸馏
Codex 自我蒸馏玩法火了!OpenAI 员工亲授:复制粘贴就能让 AI 消灭重复劳动
📌 一句话摘要 OpenAI Codex 团队成员 Vaibhav Srivastav 公开了「自我蒸馏」提示词,只需复制粘贴即可让 Codex 自动分析历史会话,将重复工作流打包为 Skill、Subagent 或 Automation,大幅提升开发效率。 📝 详细摘要 本文报道了 OpenA
📅 2026-05-27 13:12 (12 天前) 听雨 人工智能 2 分鐘 ★ 86
Codex 自我蒸馏 AI 编程 工作流自动化
告别多奖励跷跷板:Flow-OPD 将多教师 OPD 带入图像生成
📌 一句话摘要 Flow-OPD 是首个将在线策略蒸馏(OPD)引入流匹配模型的统一多任务后训练框架,通过多教师密集监督有效解决了图像生成中多任务联合优化的跷跷板效应。 📝 详细摘要 本文介绍了由中国科学技术大学、UCLA、香港中文大学和小红书等机构合作提出的 Flow-OPD 框架。该框架首次
📅 2026-05-25 14:32 (14 天前) 机器之心 人工智能 2 分鐘 ★ 86
Flow-OPD 在线策略蒸馏 流匹配模型 多任务学习
关于"蒸馏"技术局限性的探讨及个人核心竞争力的思考 | 刘润日课
📌 一句话摘要 本文通过三篇短文探讨了 AI“蒸馏”技术的局限性,指出技能可被复制但洞察、责任心等底层素质无法被算法量化,强调个人核心竞争力在于无法被蒸馏的内在品质。 📝 详细摘要 文章以刘润日课中的三篇短文为核心,结合“小师妹”的解读,探讨了 AI 时代个人核心竞争力的构建。第一篇通过计算日课
📅 2026-05-23 11:18 (16 天前) 刘润 个人成长 1 分鐘 ★ 82
AI蒸馏 核心竞争力 个人成长 底层素质
OPD 深度解析:从数学推导到 DeepSeekV4、SWIFT 与 verl 实践
📌 一句话摘要 本文从数学推导出发,系统性地解析了同策略蒸馏(OPD)的核心原理、关键维度(prefix 来源、teacher 信号粒度、KL 方向、优化方式),并详细对比了 MiniLLM、DeepSeek V4、SWIFT、verl 等主流框架的实现差异与实践选择。 📝 详细摘要 本文是一篇
📅 2026-05-15 00:22 (25 天前) 大模型智能 人工智能 3 分鐘 ★ 88
OPD 同策略蒸馏 知识蒸馏 大语言模型
Anthropic 发布报告游说美国收紧对华 AI 管制,聚焦算力与蒸馏攻击
📌 一句话摘要 Anthropic 发布报告,游说美国国会和特朗普政府收紧对华 AI 管制,提出堵住芯片走私和远程访问漏洞、立法禁止蒸馏攻击、推动美式 AI 出口等三项政策诉求。 📝 详细摘要 这条推文解读了 Anthropic 发布的一份关于中美 AI 竞争的报告。报告核心论点包括:算力是 A
📅 2026-05-15 08:36 (24 天前) meng shao 商业科技 1 分鐘 ★ 80
Anthropic AI 管制 中美竞争 算力
快手 OneSearch-V2 全量上线,生成式搜索进入「懂你」时代
📌 一句话摘要 快手技术团队发布 OneSearch-V2 生成式搜索框架,通过自蒸馏隐式推理增强、思维增强查询理解和基于用户行为反馈的偏好对齐,在不增加推理成本的前提下,显著提升电商搜索的点击率、转化率和买家数。 📝 详细摘要 本文详细介绍了快手技术团队在电商搜索领域的最新成果 OneSear
📅 2026-05-13 19:29 (26 天前) 快手技术 人工智能 2 分鐘 ★ 90
生成式搜索 自蒸馏 隐式推理 电商搜索
TPAMI 2026 | GNN 潜力真的释放了吗?BiKT 让 MLP 反向补课
📌 一句话摘要 本文介绍了一项被 TPAMI 2026 收录的研究 BiKT,该研究通过双向知识转移框架,让 GNN 与仅含特征变换操作的 MLP 互相学习,从而释放 GNN 中特征变换操作的潜力,并实现 20-100 倍的推理加速。 📝 详细摘要 本文解读了发表于 TPAMI 2026 的论文
📅 2026-05-13 12:33 (26 天前) PaperWeekly 人工智能 2 分鐘 ★ 82
GNN MLP 知识蒸馏 特征变换
VLA 大模型部署的成本被同济 ActDistill 打下来了!
📌 一句话摘要 同济大学等机构提出的 ActDistill 方法,通过动作引导的知识蒸馏和动态路由,在不牺牲性能的前提下将 VLA 大模型的计算量压缩一半以上,实现最高 1.67 倍推理加速。 📝 详细摘要 本文介绍了同济大学等机构提出的 ActDistill 方法,旨在解决 VLA(Visio
📅 2026-05-09 11:22 (05-09 11:22) PaperAgent 人工智能 2 分鐘 ★ 82
VLA 知识蒸馏 具身智能 模型压缩
速递|马斯克当庭承认,xAI 蒸馏 OpenAI 模型来训练 Grok
📌 一句话摘要 马斯克在法庭上承认,xAI 通过蒸馏 OpenAI 模型来训练 Grok,并称这是 AI 公司的普遍做法。 📝 详细摘要 本文报道了埃隆·马斯克在加州联邦法院的证词,他承认 xAI 使用了蒸馏技术从 OpenAI 模型中学习以训练其 Grok 模型。马斯克声称这种做法在 AI 公
📅 2026-05-05 11:15 (05-05 11:15) Z Potentials 人工智能 1 分鐘 ★ 80
马斯克 xAI Grok OpenAI
AI 生图论文中的四个关键洞察
📌 一句话摘要 提炼了 AI 生图综述论文中的四个关键洞察,包括数据质量、AI 生成数据污染、蒸馏必要性及开源与闭源差距。 📝 详细摘要 这条推文引用了上一条推荐的 AI 生图综述论文,并提炼了四个关键洞察:1)数据质量,尤其是最后训练阶段的少量专家质量,对用户感知影响巨大;2)训练数据中混入
📅 2026-05-01 21:48 (05-01 21:48) 向阳乔木 人工智能 1 分鐘 ★ 85
AI生图 数据质量 蒸馏 开源
#514.DeepMind 创始人 Demis Hassabis 谈 AGI、AlphaFold 与科学发现的未来
📌 一句话摘要 DeepMind 创始人 Demis Hassabis 深度探讨实现 AGI 所需的关键组件:持续学习、长期推理与记忆,并分享了 AlphaGo、AlphaFold 的成功经验与 AI 驱动科学发现的下一个突破口。 📝 详细摘要 本期节目通过播放 Y Combinator 官方播
📅 2026-04-30 14:45 (04-30 14:45) 跨国串门儿计划 人工智能 2 分鐘 ★ 85
AGI 持续学习 长期推理 强化学习
Demis Hassabis 谈 AGI 路径:2030 年到来,持续学习与长期推理是关键缺口
📌 一句话摘要 DeepMind CEO Demis Hassabis 预计 AGI 在 2030 年前后到来,指出持续学习和长期推理是当前架构的两大未解难题,并强调大小模型协同与蒸馏技术将成为未来趋势。 📝 详细摘要 本条推文是对 Demis Hassabis 在 Y Combinator 访
📅 2026-04-30 08:46 (04-30 08:46) 人工智能 1 分鐘 ★ 82
AGI Demis Hassabis 持续学习 长期推理
BestBlogs 深度解读:Demis Hassabis 谈 AGI 路径、架构缺口与深科技创业
📌 一句话摘要 BestBlogs 对 Demis Hassabis 在 Y Combinator 访谈的详细摘要,涵盖 AGI 时间线、持续学习与长期推理缺口、蒸馏技术、锯齿状智能以及给创业者的战略建议。 📝 详细摘要 本条推文是 BestBlogs 对 Demis Hassabis 在 Y
📅 2026-04-30 08:48 (04-30 08:48) 人工智能 1 分鐘 ★ 80
AGI Demis Hassabis Y Combinator 持续学习
张雪峰被蒸馏,打工人被「永生」
📌 一句话摘要 本文以「张雪峰.skill」和「同事.skill」等开源项目为引,深入探讨了 AI 技能包(Skill)技术对职场、法律和人文伦理的冲击,揭示了技术蒸馏背后关于人的工具性与主体性的深刻矛盾。 📝 详细摘要 文章从 GitHub 上爆火的「张雪峰.skill」和「同事.skill」
📅 2026-04-28 08:00 (04-28 08:00) 36氪 人工智能 1 分鐘 ★ 86
AI技能包 知识蒸馏 数字分身 AI伦理
系统聊聊 On-Policy Distillation 的原理
📌 一句话摘要 本文系统梳理了 On-Policy Distillation 的原理、与离线蒸馏和强化学习的对比,并介绍了 OPSD、SDFT、SDPO、OPCD、OEL、G-OPD 等最新研究进展。 📝 详细摘要 文章从大模型预训练、SFT、RL 的基础知识出发,引出知识蒸馏的核心概念,并深入
📅 2026-04-27 16:14 (04-27 16:14) AINLP 人工智能 2 分鐘 ★ 86
On-Policy Distillation 知识蒸馏 大模型训练 强化学习
#509.前字节研究员深度访谈:中国 AI 的真实差距、刷榜文化与 Agent 新赛道
📌 一句话摘要 前字节跳动研究员、现北大助理教授深度剖析中国 AI 现状:中美差距在拉大而非缩小,刷榜文化掩盖了模型真实可用性,蒸馏是捷径也是陷阱,Agent 和具身智能是潜在突破口。 📝 详细摘要 本期播客深度对话前字节跳动 Seed 部门研究员、现任北京大学助理教授 Chu Chu。嘉宾基于
📅 2026-04-25 23:13 (04-25 23:13) 跨国串门儿计划 人工智能 2 分鐘 ★ 88
中美 AI 差距 刷榜文化 数据蒸馏 字节跳动
影响 OPD work 的因素有哪些?聊聊 Rethinking OPD 这一路
📌 一句话摘要 本文深入分析了影响 On-Policy Distillation (OPD) 效果的关键因素,包括思维模式匹配、信息增益和跨尺寸蒸馏的挑战,并提出了冷启动和提示选择等实用干预策略。 📝 详细摘要 文章基于清华大学 THUNLP 团队的最新研究,系统探讨了 OPD 在 LLM 训练
📅 2026-04-25 00:00 (04-25 00:00) 青稞AI 人工智能 2 分鐘 ★ 87
On-Policy Distillation LLM 训练 知识蒸馏 强化学习
Transformer 可以改装成 Mamba 了:苹果把推理成本直接打成线性
📌 一句话摘要 苹果提出一种两阶段蒸馏方法,将 Transformer 模型转换为 Mamba 架构,在仅使用 2.7% 训练数据的情况下,使 1B 参数模型的困惑度从 14.89 恢复至 14.11,逼近教师模型的 13.86,实现了推理成本从平方级到线性的转变。 📝 详细摘要 本文介绍了苹果
📅 2026-04-22 11:30 (04-22 11:30) 机器之心 人工智能 2 分鐘 ★ 88
Transformer Mamba 模型蒸馏 线性注意力