全部 未讀 (102) ★ 收藏 (0) 🤖 人工智能 (86) 💻 软件编程 (7) 📊 商业科技 (5) 🎨 产品设计 (4)
篩選中: 🏷️ 强化学习 共 5 篇 ✕ 清除篩選
102
全部文章
102
未讀
31
今日新增
0
收藏
📡 Poller 最後抓取: 剛剛 (03-11 08:00)
BestBlogs ��� (102)

🏷️ 熱門標籤

AI Agent 18 OpenClaw 16 AI 智能体 7 Claude Code 6 强化学习 5 Gemini 5 AI Coding 4 开源项目 4 Google Workspace 4 数据分析 3 Cursor 3 MCP 3 开源工具 3 人机协作 3 Vibe Coding 3 软件工程 3 网络安全 2 商业模式 2 LLM 2 傅盛 2
AlphaGo 十周年:AI 创新如何铺就通往 AGI 之路
📌 一句话摘要 Demis Hassabis 回顾了 AlphaGo 十年来的遗产,追溯了它从一款博弈 AI 演变为科学突破催化剂以及实现通用人工智能 (AGI) 基石的历程。 📝 详细摘要 本文由 Google DeepMind 首席执行官 Demis Hassabis 撰写,旨在纪念 Alp
📅 1 小時前 Demis Hassabis, Demis Hassabis 人工智能 2 分鐘 ★ 82
AlphaGo AGI 强化学习 AlphaFold
陶哲轩对谈 OpenAI 高管:“试错成本”无限趋零,AI 正在把数学变成一门重工业
📌 一句话摘要 陶哲轩与 OpenAI 高管 Mark Chen 深度探讨了 AI 在数学领域的范式转移,强调数学的零试错成本与形式化验证是推动 AI 推理能力进化的核心引擎。 📝 详细摘要 本文记录了顶级数学家陶哲轩与 OpenAI o1 系列负责人 Mark Chen 的巅峰对话。核心内容聚
📅 7 小時前 AI科技大本营 人工智能 2 分鐘 ★ 94
陶哲轩 OpenAI o1 强化学习 形式化验证
ICLR 2026|小红书多模态推理大模型 Vision‑R1 :实现图文内容的深度逻辑推理与理解
📌 一句话摘要 小红书发布 Vision-R1 多模态推理大模型,通过自动化 CoT 数据生成与渐进式思维抑制训练,使 7B 模型在数学推理上比肩 OpenAI o1。 📝 详细摘要 本文介绍了小红书技术团队在多模态逻辑推理领域的最新研究成果 Vision-R1。针对多模态大模型(MLLM)在复
📅 6 小時前 小红书技术REDtech 人工智能 2 分鐘 ★ 89
多模态大模型 逻辑推理 思维链 (CoT) 强化学习
保险 AI 落地密码:技术实战分享
📌 一句话摘要 本文深度分享了京东保险如何通过 AI Agent 构建全自动保险供应链,涵盖了从领域大模型训练、知识库优化到定品、定价、履约、风控全链路落地的实战方法论。 📝 详细摘要 文章系统性地阐述了京东保险实现“全流程 AI 驱动”的技术路径。核心内容围绕 AI Agent 展开,首先提出
📅 5 小時前 京东技术 人工智能 2 分鐘 ★ 91
AI Agent 保险科技 大模型微调 RAG
告别大模型“失忆”!人大开源 MemSifter:轻量代理先思考再回忆,搞定长时记忆
📌 一句话摘要 人大团队开源 MemSifter 框架,通过轻量级代理模型实现“先思考再检索”的记忆管理,利用任务导向的强化学习显著提升大模型长时记忆的精度与效率。 📝 详细摘要 本文介绍了中国人民大学高瓴人工智能学院开源的 LLM 记忆管理框架 MemSifter。该框架针对长周期任务中大模型
📅 7 小時前 PaperAgent 人工智能 1 分鐘 ★ 85
MemSifter 长时记忆 LLM 强化学习