全部 未讀 (21615) ★ 收藏 (0) 🤖 人工智能 (11168) 📊 商业科技 (4461) 💻 软件编程 (1685) 📁 个人成长 (1605) 📁 生活文化 (857) 📁 媒体资讯 (827) 📁 投资财经 (529) 🎨 产品设计 (408) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 在线学习 共 2 篇 ✕ 清除篩選
21617
全部文章
21615
未讀
204
今日新增
0
收藏
📡 Poller 最後抓取: 31 分鐘前 (06-08 20:00)
BestBlogs 精選 (21582)

🏷️ 熱門標籤

AI Agent 2157 AI 编程 985 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 674 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 331 GitHub 321 生产力 315
【Agentic RL / 强化学习 / OPD】OpenClaw-RL 源码阅读笔记 --- (1)---基础
📌 一句话摘要 本文是 OpenClaw-RL 强化学习框架的源码阅读笔记,深入分析了其通过下一状态信号实现 Agent 在线学习的核心机制、架构设计和三种训练方法。 📝 详细摘要 本文是作者对 OpenClaw-RL 框架的源码阅读笔记系列的第一篇,旨在通过源码分析梳理强化学习相关概念。文章首
📅 2026-05-25 21:02 (13 天前) 罗西的思考 人工智能 2 分鐘 ★ 88
OpenClaw-RL 强化学习 Agentic RL 在线学习
OpenClaw-RL:让 LLM Agent 在对话中进化的在线强化学习框架
📌 一句话摘要 OpenClaw-RL 是一个开源的在线强化学习框架,通过将用户自然反馈转化为训练信号,实现 LLM Agent 的持续后台优化。 📝 详细摘要 该推文介绍了一个名为 OpenClaw-RL 的创新框架,旨在解决 LLM Agent 训练脱离实际使用场景的问题。其核心亮点在于完全
📅 2026-03-14 09:03 (03-14 09:03) meng shao 人工智能 5 分鐘 ★ 82
OpenClaw-RL 强化学习 LLM Agent 在线学习