全部 未讀 (926) ★ 收藏 (0) 🤖 人工智能 (790) 📊 商业科技 (66) 💻 软件编程 (56) 🎨 产品设计 (8) 📁 AI 产品 (7)
篩選中: 🏷️ 缩放定律 共 1 篇 ✕ 清除篩選
927
全部文章
926
未讀
244
今日新增
0
收藏
📡 Poller 最後抓取: 29 分鐘前 (03-13 14:00)
BestBlogs 精選 (927)

🏷️ 熱門標籤

AI Agent 140 OpenClaw 70 AI 智能体 70 Anthropic 46 AI 基础设施 38 软件工程 38 Claude Code 36 开发者工具 32 OpenAI 32 AI 安全 32 RAG 29 软件开发 26 Claude 25 LLM 23 AI 编程 20 Gemini 20 强化学习 19 开源 19 Replit Agent 4 17 MCP 16
利用无监督 RLVR 扩展 LLM 训练
📌 一句话摘要 探索使用无监督变动资源强化学习(RLVR,Reinforcement Learning from Variable Resources)扩展 LLM 训练的可扩展性。 📝 详细摘要 这篇推文分享了一篇研究论文,调查了通过无监督变动资源强化学习(RLVR)扩展大语言模型训练的极限与
📅 2026-03-10 23:23 (2 天前) AK 人工智能 1 分鐘 ★ 84
LLM 训练 强化学习 RLVR 缩放定律