全部 未讀 (21689) ★ 收藏 (0) 🤖 人工智能 (11201) 📊 商业科技 (4470) 💻 软件编程 (1688) 📁 个人成长 (1607) 📁 生活文化 (864) 📁 媒体资讯 (838) 📁 投资财经 (537) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ LLM 智能体 共 8 篇 ✕ 清除篩選
21691
全部文章
21689
未讀
53
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-09 02:00)
BestBlogs 精選 (21656)

🏷️ 熱門標籤

AI Agent 2173 AI 编程 994 Anthropic 981 Claude Code 917 AI 智能体 780 OpenAI 745 LLM 689 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 492 开发者工具 433 Codex 416 软件工程 399 具身智能 338 Agent 334 个人成长 334 GitHub 321 生产力 315
Import AI 451:政治超级智能;谷歌的思维社会,以及一个机器人鼓手
📌 一句话摘要 本期 Import AI 探讨了 AI 与政治基础设施的交叉点、灵巧机器人技术的进展、多智能体对齐策略、自我改进的超级智能体(Hyperagents),以及数学发现的新基准。 📝 详细摘要 Jack Clark 的 Import AI #451 全面概述了近期的 AI 研究及其社
📅 2026-03-30 20:28 (03-30 20:28) Jack Clark 人工智能 1 分鐘 ★ 87
AI 研究 多智能体系统 机器人技术 AI 对齐
构建“人在回路”的智能体工作流
📌 一句话摘要 本文深入探讨了如何使用 LangGraph 构建“人在回路”(Human-in-the-Loop, HITL)的智能体工作流,详细介绍了如何利用中断(interrupts)和检查点(checkpointers)在 AI 驱动的内容生成中实现人工监督。 📝 详细摘要 作者认为,尽管
📅 2026-03-25 20:00 (03-25 20:00) Kenneth Leung 人工智能 2 分鐘 ★ 87
LangGraph LLM 智能体 人在回路 AI 编排
生产就绪的 LLM 智能体:离线评估的综合框架
📌 一句话摘要 本文提供了一个严谨的三支柱框架——路由(Routing)、LLM-as-Judge(大模型作为评判者)和 RAG 评估——旨在通过自动化的离线测试,将实验性的 LLM 智能体转化为生产就绪的系统。 📝 详细摘要 本文探讨了 AI 开发中关键的“生产鸿沟”问题,即令人印象深刻的演示
📅 2026-03-24 21:30 (03-24 21:30) Mukul Sood 人工智能 20 分鐘 ★ 91
LLM 智能体 离线评估 RAGAS LLM-as-Judge
HubSpot 的 Sidekick:多模型 AI 代码审查,反馈速度提升 90%,工程师认可度达 80%
📌 一句话摘要 HubSpot 的 AI 智能体“Sidekick”利用多模型架构和“评判智能体”(Judge Agent)模式,将代码审查速度提升了 90%,确保提供高质量、可操作的反馈。 📝 详细摘要 HubSpot 开发了 Sidekick,这是一个内部 AI 代码审查智能体,旨在消除 P
📅 2026-03-18 22:38 (03-18 22:38) Leela Kumili 软件编程 12 分鐘 ★ 84
AI 代码审查 LLM 智能体 软件工程 开发者生产力
代理式 AI 助力智能文档提取与 LlamaParse
📌 一句话摘要 LlamaIndex 推出代理式文档提取技术,通过“计划-执行-验证”循环和视觉定位技术,克服了传统基于模板的 OCR 的局限性。 📝 详细摘要 该推文讨论了文档提取从传统 OCR 向代理式 AI (Agentic AI) 的转变。它强调了代理式工作流(计划-执行-验证循环)如何
📅 2026-03-17 00:05 (03-17 00:05) LlamaIndex 🦙 人工智能 1 分鐘 ★ 84
Agentic AI 文档提取 LlamaParse OCR
关于 LLM 智能体泛化能力与强化学习微调的新研究
📌 一句话摘要 一篇研究论文探讨了强化学习微调如何影响 LLM 智能体的泛化能力,发现跨环境的序列训练比直接迁移更为有效。 📝 详细摘要 这条推文重点介绍了一项关于通过强化学习 (RL) 训练的 LLM 智能体泛化能力的研究。该研究表明,尽管 RL 微调在熟悉的环境中(例如,从 WebShop
📅 2026-03-15 01:56 (03-15 01:56) elvis 人工智能 4 分鐘 ★ 83
LLM 智能体 泛化能力 强化学习 微调
构建像数据科学家一样思考的智能体:我们如何通过可复用工具生成在 DABStep 上取得第一名
📌 一句话摘要 NVIDIA KGMON 团队推出了一种三阶段智能体架构,通过将复杂推理提炼成可复用、优化的 Python 工具,实现了 SOTA 数据分析性能。 📝 详细摘要 本文详细介绍了 NVIDIA KGMON Data Explorer,这是一个基于 NeMo Agent Toolki
📅 2026-03-13 09:02 (03-13 09:02) Jiwei Liu, Maximilian Jeblick, Jack Yu 人工智能 2 分鐘 ★ 91
LLM 智能体 数据科学 NVIDIA NeMo DABStep 基准测试
AI 将被用于“失控”配置 —— LessWrong
📌 一句话摘要 本文指出,被批评为“不切实际”的 AI 安全评估实际上反映了现实世界的部署风险,在这些场景中,无监督循环和高压提示词等“失控”配置非常普遍。 📝 详细摘要 作者挑战了常见的批评,即 AI 安全评估过于极端或“失控”而缺乏相关性。通过分析当前的行业实践,文章证明了现实世界的部署经常
📅 2026-03-11 19:19 (03-11 19:19) Arthur Conmy 人工智能 9 分鐘 ★ 84
AI 安全 LLM 智能体 模型评估 智能体工作流