📡 Poller 最後抓取: 32 分鐘前 (06-09 00:00)
BestBlogs 精選 (21638)
🏷️ 熱門標籤
● AdamW 和 Muon 的失稳根源有解了,港中文新优化器 Pion:在等谱流形上更新大模型
● 从「婴儿期」到「青年期」:四位开发者眼中的中国算力生态
● 大模型自信且短视!Next-ToBE 破除 Next Token 预测诅咒 | ICLR'26
📅 2026-05-10 12:49 (29 天前) 新智元 人工智能 2 分鐘 ★ 87
● 全面梳理 Muon 优化器的工业挑战及应用实践
📅 2026-05-04 12:00 (05-04 12:00) AI闲谈 人工智能 2 分鐘 ★ 87
● 系统聊聊 On-Policy Distillation 的原理
📅 2026-04-27 16:14 (04-27 16:14) AINLP 人工智能 2 分鐘 ★ 86
● HuggingFace 月榜第一!北大开源:你的全自动模型加工厂来了
● 北大联合 Llama-Factory 推出 DataFlex:工业级数据动态训练系统
● 面向 Ascend 950,CANN 技术架构的变与不变
● 你不知道的大模型训练:原理、路径与新实践
● 推荐一款高效的 Web 抓取工具 XCrawl
● 技术洞察:基于合成数据的 SFT 训练
📅 2026-03-31 19:51 (03-31 19:51) Simon Willison 人工智能 1 分鐘 ★ 80
● 深度解析第三代 RLVR 模型的训练过程:从模仿人类到自我进化
● 谷歌 TPU 能撼动英伟达吗?前 TPU 工程师首次揭秘
● 英伟达 GPU 全系列硬核科普手册:一文读懂 NVIDIA 芯片的定位、规格与应用场景
● Qwen3.5 × Twinkle 低成本模型训练最佳实践