📡 Poller 最後抓取: 1 小時前 (06-08 18:00)
BestBlogs 精選 (21565)
🏷️ 熱門標籤
● openJiuwen 社区又上新: JiuwenSwarm 给 Harness 装上「后训练」
📅 2026-06-05 14:30 (3 天前) InfoQ 中文 人工智能 2 分鐘 ★ 85
● 22.9 倍加速!FlashAR:仅用 0.05%数据,让预训练好的自回归图像模型飞起来
● 从 KL 的方向看 SFT 与 RL:大模型到底是在”学会做”,还是在”学会选”?
● 时薪 800、学历硕士起:大厂热抢的 AI 数据“炼金师”到底在做什么?
● ACL 2026 Findings | 浙大提出 GFT:On-Policy SFT 视角下的奖励微调
● 无惧 Off-Policy 偏移!Bengio 团队解绑后训练,大模型 RL 提速 50 倍
📅 2026-05-12 17:07 (27 天前) PaperWeekly 人工智能 2 分鐘 ★ 88
● 前 OpenAI 研究员离职文章核心观点提炼:后训练、评估、对齐与 AI 依赖风险
● DeepSeek-V4 技术报告解读: 从架构到 Infra 的全栈重构
📅 2026-04-28 12:06 (04-28 12:06) 青稞AI 人工智能 2 分鐘 ★ 88
● AI 真能搞钱了!这家公司把大模型玩成闭环赚钱机器
● AI 真能搞钱了!这家公司把大模型玩成闭环赚钱机器
● 小米罗福莉深度访谈:AI 范式向 Agent 后训练巨变
● 138. 对罗福莉 3.5 小时访谈:AI 范式已然巨变!OpenClaw、Agent 范式很吃后训练、卡的分配、组织平权
● The Art of Efficient Reasoning: 大道至简做好思维链压缩!
📅 2026-04-15 19:00 (04-15 19:00) 青稞AI 人工智能 2 分鐘 ★ 87
● Hugging Face 发布 TRL v1,开启开源模型后训练新时代
📅 2026-04-01 07:23 (04-01 07:23) clem 🤗 人工智能 1 分鐘 ★ 87
● Intercom 新推出的后训练模型 Fin Apex 1.0 在客户服务解决率方面超越了 GPT-5.4 和 Claude Sonnet 4.6
● 通过“监控敏感训练”(Monitor Sensitive Training)教导模型构想更好的监控机制 — LessWrong
● [AI 新闻] 上下文干旱
● Garry Tan 重申 AI 后训练不存在“规模化瓶颈”