SuperPortia Reading
總覽
文章
簡報
🔍 搜尋
全部
未讀 (21636)
★ 收藏 (0)
🤖 人工智能 (11175)
📊 商业科技 (4465)
💻 软件编程 (1685)
📁 个人成长 (1606)
📁 生活文化 (860)
📁 媒体资讯 (828)
📁 投资财经 (533)
🎨 产品设计 (409)
📁 AI 产品 (39)
📁 体育运动 (28)
篩選中:
🏷️ Newton-Schulz
共 2 篇
✕ 清除篩選
21638
全部文章
21636
未讀
225
今日新增
0
收藏
📡 Poller
最後抓取:
23 分鐘前
(06-08 22:00)
BestBlogs 精選 (21603)
🏷️ 熱門標籤
AI Agent
2161
AI 编程
988
Anthropic
981
Claude Code
916
AI 智能体
780
OpenAI
745
LLM
677
开源
574
OpenClaw
557
Claude
557
AI
517
AI 安全
490
开发者工具
432
Codex
416
软件工程
399
具身智能
335
Agent
334
个人成长
333
GitHub
321
生产力
315
●
全面梳理 Muon 优化器的工业挑战及应用实践
📌 一句话摘要 本文系统梳理了 Muon 优化器的数学原理、分布式训练工程挑战及工业落地案例,涵盖 Moonlight、Kimi K2、GLM-4.5、DeepSeek-V4 等主流大模型的应用实践。 📝 详细摘要 本文对 Muon 优化器进行了全面而深入的技术梳理。文章首先从数学原理出发,解释
📅 2026-05-04 12:00
(05-04 12:00)
AI闲谈
人工智能
2 分鐘
★ 87
Muon 优化器
大模型训练
分布式训练
Newton-Schulz
●
不加算力,只改一个算法:Muon 在万亿 MoE 模型中最高 2 倍加速
📌 一句话摘要 本文介绍了 Gram Newton-Schulz 算法,通过将 Muon 优化器的迭代过程转移到更小的 Gram 矩阵上,在万亿级 MoE 模型训练中实现了最高 2 倍的优化器加速。 📝 详细摘要 普林斯顿大学和纽约大学的研究者(包括 Tri Dao)提出了 Gram Newto
📅 2026-03-31 13:36
(03-31 13:36)
机器之心
人工智能
1 分鐘
★ 92
Muon 优化器
Newton-Schulz
MoE 模型
模型训练优化