全部 未讀 (12239) ★ 收藏 (0) 🤖 人工智能 (7794) 📊 商业科技 (1919) 💻 软件编程 (1219) 📁 个人成长 (762) 🎨 产品设计 (214) 📁 生活文化 (131) 📁 媒体资讯 (80) 📁 投资财经 (76) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 泛化能力 共 6 篇 ✕ 清除篩選
12241
全部文章
12239
未讀
111
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-18 20:00)
BestBlogs 精選 (12220)

🏷️ 熱門標籤

AI Agent 1371 AI 智能体 738 Claude Code 656 Anthropic 651 LLM 564 AI 编程 538 OpenClaw 501 开源 445 AI 安全 410 Claude 400 AI 398 OpenAI 371 软件工程 359 开发者工具 349 生产力 308 GitHub 254 自动化 241 AI 基础设施 229 AI 开发 226 MCP 225
LLM 与特定领域的人类专业水平对比
📌 一句话摘要 Gary Marcus 认为,像 Garry Kasparov 这样已退役的专家,依然能击败任何没有配备专用工具的 LLM。 📝 详细摘要 作为扑克相关推文的后续,Marcus 指出,尽管有海量的公开国际象棋数据可供训练,但顶尖的人类专家(如 Garry Kasparov)在比赛
📅 2026-04-11 05:31 (7 天前) Gary Marcus 人工智能 1 分鐘 ★ 76
国际象棋 AI 泛化能力 人机对战 领域专家
悟空 Agent 泛化能力首次披露:从一张旧病历引出三个新确诊
📌 一句话摘要 本文首次披露了腾讯悟空 Agent 在漏洞挖掘中的「泛化能力」,展示了其如何从单个已知漏洞出发,通过高、中、低三种相似度策略系统性地识别同源及跨模块漏洞。 📝 详细摘要 文章深入探讨了 AI 在代码安全领域的进阶应用,重点介绍了腾讯悟空 Agent 的核心竞争力——泛化能力。不同
📅 2026-04-10 17:35 (8 天前) 腾讯技术工程 人工智能 5 分鐘 ★ 86
悟空 Agent AI 安全 漏洞挖掘 泛化能力
AI:知识的“图书管理员”还是科学探索者?
📌 一句话摘要 弗朗索瓦·肖莱 (François Chollet) 认为,当前的 AI 模型更像是现有知识的“图书管理员”,而非具备科学发现能力的“探索者”。 📝 详细摘要 在这条推文中,弗朗索瓦·肖莱对当前的 AI 发展进行了哲学层面的批判。他将现有的模型描述为仅仅是知识的存储库(即“图书管
📅 2026-03-20 01:02 (29 天前) François Chollet 人工智能 1 分鐘 ★ 82
AI 大语言模型 (LLM) 科学发现 泛化能力
前沿模型依赖于记忆,而非泛化
📌 一句话摘要 肖莱引用 EsoLang-Bench 的结果指出,前沿大语言模型 (LLM) 依赖于内容层面的记忆,而非真正的可泛化问题解决能力。 📝 详细摘要 肖莱参考了 EsoLang-Bench 的测试结果,在该测试中,LLM 在处理不熟悉的编程语言时表现大幅下滑。他认为,当前的前沿模型缺
📅 2026-03-20 01:09 (29 天前) François Chollet 人工智能 1 分鐘 ★ 88
EsoLang-Bench 大语言模型 (LLM) 泛化能力 记忆能力
更全面的具身智能真机评测来了!CVPR 2026 ManipArena 挑战赛邀你打榜
📌 一句话摘要 ManipArena 是由中山大学等机构推出的具身智能真机评测挑战赛,旨在通过分层 OOD 评估和 56 维感知数据,建立科学的机器人泛化能力评价标准。 📝 详细摘要 本文详细介绍了在 CVPR 2026 上推出的 ManipArena 具身智能挑战赛。该赛事针对当前具身智能领域
📅 2026-03-18 15:37 (03-18 15:37) 机器之心 人工智能 10 分鐘 ★ 85
具身智能 机器人操作 VLA 模型 世界模型
关于 LLM 智能体泛化能力与强化学习微调的新研究
📌 一句话摘要 一篇研究论文探讨了强化学习微调如何影响 LLM 智能体的泛化能力,发现跨环境的序列训练比直接迁移更为有效。 📝 详细摘要 这条推文重点介绍了一项关于通过强化学习 (RL) 训练的 LLM 智能体泛化能力的研究。该研究表明,尽管 RL 微调在熟悉的环境中(例如,从 WebShop
📅 2026-03-15 01:56 (03-15 01:56) elvis 人工智能 4 分鐘 ★ 83
LLM 智能体 泛化能力 强化学习 微调