全部 未讀 (21671) ★ 收藏 (0) 🤖 人工智能 (11190) 📊 商业科技 (4470) 💻 软件编程 (1687) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (833) 📁 投资财经 (536) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 大模型训练 共 15 篇 ✕ 清除篩選
21673
全部文章
21671
未讀
35
今日新增
0
收藏
📡 Poller 最後抓取: 32 分鐘前 (06-09 00:00)
BestBlogs 精選 (21638)

🏷️ 熱門標籤

AI Agent 2168 AI 编程 991 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 684 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
AdamW 和 Muon 的失稳根源有解了,港中文新优化器 Pion:在等谱流形上更新大模型
📌 一句话摘要 香港中文大学等机构提出 Pion 优化器,通过在等谱流形上更新参数,从根源上解决大模型训练中的谱结构失控和稳定性问题。 📝 详细摘要 本文介绍了由香港中文大学等机构提出的新型优化器 Pion。该优化器的核心创新在于,它不再像 AdamW 或 Muon 那样采用加法更新范式,而是直
📅 2026-05-30 10:30 (9 天前) 机器之心 人工智能 2 分鐘 ★ 88
Pion 优化器 大模型训练 训练稳定性
从「婴儿期」到「青年期」:四位开发者眼中的中国算力生态
📌 一句话摘要 本文通过四位开发者的实战案例,展示了中国昇腾鲲鹏算力生态从「能用」到「好用易用」的演进,涵盖大模型训练、金融核心系统、气象科学计算和底层算法优化等场景。 📝 详细摘要 文章以鲲鹏昇腾开发者大会 2026 为背景,通过四位不同领域开发者的真实实践,系统呈现了中国算力生态的成熟度现状
📅 2026-05-27 21:30 (12 天前) 36氪 人工智能 2 分鐘 ★ 83
昇腾 鲲鹏 算力生态 大模型训练
大模型自信且短视!Next-ToBE 破除 Next Token 预测诅咒 | ICLR'26
📌 一句话摘要 华东师范大学与复旦大学团队在 ICLR 2026 提出 Next-ToBE 方法,通过将 Next Token Prediction 的 one-hot 目标分布替换为覆盖未来窗口的软目标分布,以轻量方式激活大模型的前瞻能力,在数学推理、代码生成等任务上显著提升性能。 📝 详细摘
📅 2026-05-10 12:49 (29 天前) 新智元 人工智能 2 分鐘 ★ 87
Next Token Prediction Next-ToBE 大模型训练 长程推理
全面梳理 Muon 优化器的工业挑战及应用实践
📌 一句话摘要 本文系统梳理了 Muon 优化器的数学原理、分布式训练工程挑战及工业落地案例,涵盖 Moonlight、Kimi K2、GLM-4.5、DeepSeek-V4 等主流大模型的应用实践。 📝 详细摘要 本文对 Muon 优化器进行了全面而深入的技术梳理。文章首先从数学原理出发,解释
📅 2026-05-04 12:00 (05-04 12:00) AI闲谈 人工智能 2 分鐘 ★ 87
Muon 优化器 大模型训练 分布式训练 Newton-Schulz
系统聊聊 On-Policy Distillation 的原理
📌 一句话摘要 本文系统梳理了 On-Policy Distillation 的原理、与离线蒸馏和强化学习的对比,并介绍了 OPSD、SDFT、SDPO、OPCD、OEL、G-OPD 等最新研究进展。 📝 详细摘要 文章从大模型预训练、SFT、RL 的基础知识出发,引出知识蒸馏的核心概念,并深入
📅 2026-04-27 16:14 (04-27 16:14) AINLP 人工智能 2 分鐘 ★ 86
On-Policy Distillation 知识蒸馏 大模型训练 强化学习
HuggingFace 月榜第一!北大开源:你的全自动模型加工厂来了
📌 一句话摘要 本文介绍了北京大学 DCAI 团队联合多家机构开源的 DataFlex 框架,这是一个以数据为中心的动态训练框架,旨在通过智能调度训练数据(动态选择、混合、加权)来提升大模型训练的效率和最终性能。 📝 详细摘要 文章详细介绍了由北京大学 DCAI 团队牵头,联合多家研究机构开源的
📅 2026-04-20 22:30 (04-20 22:30) Datawhale 人工智能 2 分鐘 ★ 88
DataFlex 以数据为中心的AI 动态训练 大模型训练
北大联合 Llama-Factory 推出 DataFlex:工业级数据动态训练系统
📌 一句话摘要 北京大学团队联合 Llama-Factory 等机构开源了 DataFlex,这是一个建立在 Llama-Factory 之上的统一数据中心动态训练框架,旨在将数据选择、混合和加权等动态调度能力系统化地融入大模型训练流程。 📝 详细摘要 文章介绍了由北京大学张文涛教授、鄂维南院士
📅 2026-04-15 12:21 (04-15 12:21) 机器之心 人工智能 2 分鐘 ★ 89
DataFlex 数据中心AI 大模型训练 动态数据调度
面向 Ascend 950,CANN 技术架构的变与不变
📌 一句话摘要 本文深入解析了华为昇腾新一代 AI 芯片 Ascend 950PR 与 Ascend 950DT 的硬件架构、核心特性及互联技术,重点介绍了其在计算、存储、互联三大维度的系统性升级,旨在为大规模 AI 训练与推理提供更强算力底座。 📝 详细摘要 文章详细介绍了华为昇腾最新发布的
📅 2026-04-14 18:06 (04-14 18:06) CSDN 人工智能 2 分鐘 ★ 87
昇腾 Ascend AI 芯片 硬件架构 大模型训练
你不知道的大模型训练:原理、路径与新实践
📌 一句话摘要 本文系统梳理了 2026 年大模型训练的全链路架构,深入剖析了从预训练、数据工程、后训练到 Agent 训练与 Harness 优化的关键技术决策与工程实践。 📝 详细摘要 文章详细拆解了现代大模型训练的九阶段流水线,强调了预训练仅是底座,真正的用户体验差异源于后训练、评测与奖励
📅 2026-04-04 01:00 (04-04 01:00) Tw93 人工智能 2 分鐘 ★ 93
大模型训练 LLM RLHF Agent
推荐一款高效的 Web 抓取工具 XCrawl
📌 一句话摘要 博主推荐使用 XCrawl 工具进行高效的网页抓取,支持 MCP 和 curl,可将搜索结果直接转换为 Markdown 或 JSON,适合大模型训练资料收集。 📝 详细摘要 博主分享了在进行大模型训练资料收集时使用的工具 XCrawl。该工具支持单页抓取、全站递归及搜索结果采集
📅 2026-04-03 12:36 (04-03 12:36) Tw93 软件编程 1 分鐘 ★ 81
XCrawl 数据抓取 大模型训练 开发者工具
技术洞察:基于合成数据的 SFT 训练
📌 一句话摘要 Simon Willison 重点介绍了该项目的技术细节,特别是使用由 Claude Haiku 和 GPT-4o-mini 生成的合成对话示例进行有监督微调(SFT)的方法。 📝 详细摘要 在这篇后续推文中,Simon Willison 提到了 Trip 关于一个模型训练项目的
📅 2026-03-31 19:51 (03-31 19:51) Simon Willison 人工智能 1 分鐘 ★ 80
SFT 合成数据 大模型训练 Claude Haiku
深度解析第三代 RLVR 模型的训练过程:从模仿人类到自我进化
📌 一句话摘要 本文深度解析了第三代 RLVR(可验证奖励强化学习)模型,阐述了其从依赖人类反馈转向利用客观验证器进行自我进化和深度推理的核心范式,并详细拆解了数学证明与编程竞赛中的具体实现策略。 📝 详细摘要 文章系统性地梳理了第三代大模型训练范式——RLVR(Reinforcement Le
📅 2026-03-29 10:10 (03-29 10:10) 青稞AI 人工智能 35 分鐘 ★ 89
RLVR 大模型训练 强化学习 推理能力
谷歌 TPU 能撼动英伟达吗?前 TPU 工程师首次揭秘
📌 一句话摘要 本文通过前谷歌 TPU 工程师的深度访谈,剖析了 TPU 与 GPU 在架构、成本、供应链及软件生态上的差异,并探讨了 TPU 在大规模部署场景下挑战英伟达的可能性与局限。 📝 详细摘要 文章以深度访谈形式,邀请前谷歌 TPU 工程师揭秘 TPU 的研发历程与技术哲学。TPU 采
📅 2026-03-24 14:01 (03-24 14:01) 硅谷101 人工智能 13 分鐘 ★ 89
TPU GPU 英伟达 AI 算力
英伟达 GPU 全系列硬核科普手册:一文读懂 NVIDIA 芯片的定位、规格与应用场景
📌 一句话摘要 本文是一份详尽的英伟达 GPU 全系列百科全书,系统梳理了从消费级到数据中心级的芯片定位、核心规格及 AI 模型选型逻辑。 📝 详细摘要 这篇文章由腾讯技术工程团队发布,旨在为开发者和企业提供一套完整的 NVIDIA GPU 选型指南。文章将庞杂的 GPU 家族划分为五大产品线:
📅 2026-03-20 17:37 (03-20 17:37) 腾讯技术工程 人工智能 8 分鐘 ★ 88
英伟达 GPU 选型 AI 硬件 大模型训练
Qwen3.5 × Twinkle 低成本模型训练最佳实践
📌 一句话摘要 本文介绍了通义实验室开源的 Twinkle 大模型训练框架,通过 Qwen3.5 实战展示了其在低成本 LoRA 微调、强化学习(GRPO)及云端训推分离场景下的高效应用。 📝 详细摘要 文章详细阐述了通义实验室最新开源的 Twinkle 框架,旨在解决大模型分布式训练中显存占用
📅 2026-03-12 17:20 (03-12 17:20) 通义大模型 人工智能 2 分鐘 ★ 85
Twinkle Qwen3.5 大模型训练 LoRA