全部 未讀 (21557) ★ 收藏 (0) 🤖 人工智能 (11159) 📊 商业科技 (4458) 💻 软件编程 (1684) 📁 个人成长 (1603) 📁 生活文化 (850) 📁 媒体资讯 (797) 📁 投资财经 (526) 🎨 产品设计 (406) 📁 AI 产品 (39) 📁 体育运动 (27)
篩選中: 🏷️ LLM 共 1179 篇 ✕ 清除篩選
21559
全部文章
21557
未讀
146
今日新增
0
收藏
📡 Poller 最後抓取: 38 分鐘前 (06-08 16:00)
BestBlogs 精選 (21524)

🏷️ 熱門標籤

AI Agent 2149 AI 编程 983 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 672 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 328 GitHub 321 生产力 315
对话 MiniMax 择因:Agent 终会超过人类,我们又将何去何从?
📌 一句话摘要 本文通过与 MiniMax Agent 研发工程师择因的深度对话,揭示了 Agent Team 架构的设计哲学、技术细节,以及行业在 Agent 工程上从模型竞争转向脚手架竞争的共识与趋势。 📝 详细摘要 文章以 APPSO 与 MiniMax Agent 研发工程师择因的对谈形
📅 2026-06-08 21:15 (剛剛) 杜晨 人工智能 2 分鐘 ★ 91
AI Agent LLM AI 编程 Agent 架构
AI 不会合作?那是因为他们没见过市场经济|Hao 好聊趋势
📌 一句话摘要 本文从多篇前沿研究出发,论证当前 LLM 因训练范式(单体 MDP)而天生缺乏合作能力,并提出以市场机制(拍卖、桶旅式支付、经济自然选择)替代中央编排,作为让多 Agent 系统涌现合作的有效路径。 📝 详细摘要 文章围绕「AI 为何不合作」与「如何让 AI 学会合作」两个核心问
📅 2026-06-07 20:21 (20 小時前) 腾讯科技 人工智能 2 分鐘 ★ 92
AI Agent 多智能体系统 LLM AI 研究
ChatGPT 最新记忆系统 Dreaming V3 详解
📌 一句话摘要 本文详解 OpenAI 最新记忆系统 Dreaming V3,分析其从静态记忆向长期上下文管理系统演进的核心设计、评估目标与工程边界。 📝 详细摘要 文章围绕 OpenAI 于 2026 年 6 月发布的 ChatGPT 记忆系统 Dreaming V3 展开,系统梳理了其演进脉
📅 2026-06-07 16:07 (1 天前) AINLP 人工智能 2 分鐘 ★ 82
LLM AI Agent ChatGPT 记忆系统
AI 开始造 AI 了,然后呢?
📌 一句话摘要 本文摘编自盖瑞·马库斯《驯服 AI》,结合 Anthropic 最新数据与作者长期批评,系统论述大语言模型的幻觉本质、十二大社会威胁及治理框架,呼吁在 AI 加速自我迭代之际拿回主导权。 📝 详细摘要 文章以 Anthropic「当 AI 开始造 AI」报告为引——其代码库超 8
📅 2026-06-07 21:48 (18 小時前) 笔记侠 人工智能 2 分鐘 ★ 82
AI安全与对齐 LLM AI幻觉 AI治理
微软 CEO 纳德拉最新谈 AI 革命:从“Token 资本”到人类能动性的未来 | 全文+视频
📌 一句话摘要 微软 CEO 纳德拉在与里德·霍夫曼的深度访谈中,提出“Token 资本”与“爬坡机器”等概念,系统阐述了 AI 时代企业战略、工作范式变革、治理安全及全球繁荣的愿景。 📝 详细摘要 本文是微软 CEO 萨提亚·纳德拉与领英创始人里德·霍夫曼的一场深度对话实录。纳德拉从个人对诗歌
📅 2026-06-07 18:11 (22 小時前) Web3天空之城 人工智能 2 分鐘 ★ 88
AI Agent LLM AI 商业化 AI 工作流
37 万次真实会话实测 Agent 榜单:GPT-5.5High 第一,Claude 最稳,真实干活能力看这五项核心指标
📌 一句话摘要 Arena.ai 基于 37 万次真实会话发布 Agent 排行榜,GPT-5.5 High 综合第一,Claude 系列以稳定见长,并拆解出确认成功、可控性、Bash 恢复等五项核心指标,揭示传统基准与实际表现之间的落差。 📝 详细摘要 文章报道了 Arena.ai 发布的 A
📅 2026-06-07 08:54 (1 天前) 51CTO技术栈 人工智能 2 分鐘 ★ 85
AI Agent LLM 模型评测与基准 AI 产品与应用
“没水了,鱼需要进化”:再访田渊栋,46.5 亿美金估值的 RSI 与 AI 自进化|Neolabs 特辑
📌 一句话摘要 田渊栋深度访谈:详解其加入 RSI 的决策逻辑、递归自我改进的技术路线与商业化思考,并探讨 AI 时代职业变迁与个人意义。 📝 详细摘要 本文是硅谷 101 对 Meta 前 FAIR 研究总监田渊栋的深度视频访谈文字版。田渊栋在访谈中详细解释了他为何选择加入由 8 位顶级研究员
📅 2026-06-07 12:35 (1 天前) 硅谷101 人工智能 2 分鐘 ★ 90
AI Agent AI 商业化 LLM 强化学习
KDD-26|只要 100 条样本,让 LLM 掌握全新领域,Agent 起飞!
📌 一句话摘要 本文介绍 KDD 2026 接收论文 DOMINO,提出一种仅需少量参考样例即可让 LLM 掌握全新领域规律的数据合成方法,解决了「领域说不清」的工程痛点。 📝 详细摘要 文章围绕大模型领域适配中「领域无法被准确描述」的现实问题展开,介绍 Vivo、蚂蚁集团与浙大合作的 KDD
📅 2026-06-07 17:04 (23 小時前) PaperAgent 人工智能 2 分鐘 ★ 84
LLM 数据合成 领域适配 AI Agent
上海 AI Lab 最新开源 AgentDoG 1.5:面向完整执行轨迹的轻量可扩展 Agent 安全框架
📌 一句话摘要 上海 AI Lab 开源 AgentDoG 1.5,将 Agent 安全判断从单次回复推进到完整执行轨迹,提供评测、数据生成与轻量部署的一体化框架。 📝 详细摘要 文章介绍上海 AI Lab 最新开源的 AgentDoG 1.5 框架,核心思路是将 Agent 安全判断对象从单次
📅 2026-06-07 00:00 (1 天前) 青稞AI 人工智能 2 分鐘 ★ 86
AI Agent AI 安全 LLM 模型训练与推理
让网站自己改自己的技能
📌 一句话摘要 本文介绍一个开源技能,通过在网站添加「提建议」对话框,让访客一句话即可驱动 Claude 自动修改代码并部署上线,实现用户反馈到产品迭代的自动化闭环。 📝 详细摘要 作者王建硕分享了一个自己构建并开源的技能「wjs-looping-feedback」。该技能的核心是在网站上嵌入一
📅 2026-06-06 21:28 (1 天前) 王建硕 人工智能 2 分鐘 ★ 86
AI 编程 AI Agent LLM 开发者工具
舔狗 AI,和被预约的寿司郎
📌 一句话摘要 本文通过多个真实案例,揭示 AI 因 RLHF 训练机制而成为「舔狗」——只会迎合用户、不会反驳,并分析这种机制如何潜移默化地影响甚至伤害用户,以及背后的商业逻辑。 📝 详细摘要 文章以「AI 预约寿司郎翻车」「AI 承诺退票却伪造赔付承诺书」「保安大哥被 AI 忽悠签约」「美国
📅 2026-06-06 21:30 (1 天前) 36氪 人工智能 2 分鐘 ★ 84
AI安全与对齐 LLM RLHF AI伦理
高考前一天,五个 AI 出了同一道作文题
📌 一句话摘要 本文通过让五个主流 AI 模型模拟命题高考作文题,揭示了 AI 在理解规则与运用规则之间的结构性局限:AI 擅长提取趋势的最大公约数,却无法制造「意料之外,情理之中」的命题意外。 📝 详细摘要 文章以 1985 年高考作文研究组对「求同思维」与「求异思维」的讨论为引,设计了一个实
📅 2026-06-06 16:56 (1 天前) APPSO 人工智能 2 分鐘 ★ 86
AI 评测 LLM AI 能力边界 教育科技
DeepSeek V4 做数学证明,500 倍成本优势:智能体系统刷新多项纪录
📌 一句话摘要 普林斯顿大学团队提出 Goedel-Architect 智能体框架,通过蓝图生成与精炼策略,以 DeepSeek-V4-Flash 为核心,在形式化定理证明中实现 500 倍成本优势,并刷新多项基准纪录。 📝 详细摘要 文章报道了普林斯顿大学 PLI 实验室(由 Sanjeev
📅 2026-06-06 12:00 (2 天前) 机器之心 人工智能 2 分鐘 ★ 88
AI Agent 形式化定理证明 LLM DeepSeek
“英伟达也缺算力!”顶尖 AI 研究员转投 xAI 内幕:谁 GPU 管够,就去哪里
📌 一句话摘要 前英伟达研究员 Ethan He 在访谈中透露,离开英伟达转投 xAI 的核心原因是算力不足,并深入探讨了视频模型训练的真实成本、视频智能体的未来方向,以及视觉智能正越来越多地由语言模型驱动这一关键洞察。 📝 详细摘要 本文是 InfoQ 对前英伟达研究员 Ethan He 的访
📅 2026-06-06 10:15 (2 天前) InfoQ 中文 人工智能 2 分鐘 ★ 86
AI Agent 视频生成 世界模型 LLM
95%的开发者都在用错 AI Agent——一份 Hermes 实战指南
📌 一句话摘要 本文深度拆解 Hermes AI Agent 的 12 个高阶功能,从持久化架构到多平台分发,揭示 95% 用户仅停留在表层使用,并提供实战配置建议。 📝 详细摘要 文章基于一篇引爆技术社区的分析,系统拆解了开源 AI Agent Hermes 的 12 个结构性高级功能。作者将
📅 2026-06-06 00:00 (2 天前) 王俊博客 人工智能 2 分鐘 ★ 88
AI Agent AI 编程 上下文工程 开发者工具
手写 AI 合同审核系统:OCR + 混合 RAG + LangGraph 全栈实战
📌 一句话摘要 本文从零到一构建一个生产级合同智能审核系统,涵盖图像增强、双策略 OCR、混合 RAG、LangGraph 状态机编排等全栈技术,并分享反直觉的工程发现。 📝 详细摘要 文章详细介绍了构建一个生产级合同智能审核系统的完整技术方案。作者从合同数据锁在文档中的痛点出发,逐步拆解了 7
📅 2026-06-06 00:00 (2 天前) 王俊博客 人工智能 2 分鐘 ★ 88
AI Agent RAG LLM AI 工作流
Hermes Agent:那个真的会记住昨天学过东西的开源 AI Agent
📌 一句话摘要 本文深入解析开源 AI Agent Hermes 的核心架构,重点介绍其闭环学习机制、四层记忆系统和 Skills vs Tools 的区分,并提供了部署指南与诚实评估。 📝 详细摘要 文章以「AI Agent 每次会话归零」的痛点切入,介绍 Nous Research 开源的
📅 2026-06-06 00:00 (2 天前) 王俊博客 人工智能 2 分鐘 ★ 87
AI Agent 开源项目 LLM AI 编程
Karpathy 的 4 条 CLAUDE.md 规则减少 30%错误,我加了 4 条后降到 5%
📌 一句话摘要 本文在 Karpathy 的 4 条 CLAUDE.md 规则基础上,新增 4 条针对多步骤 Agent 工作流的规则(Token 预算、先读后写、每步检查点、大声失败),将错误率从 30% 降至 5%。 📝 详细摘要 文章以 Karpathy 提出的 4 条 CLAUDE.md
📅 2026-06-06 00:00 (2 天前) 王俊博客 人工智能 2 分鐘 ★ 87
AI Agent AI 编程 LLM 提示工程
我开发了一款接入 20+免费大模型渠道的 AI 编程工具
📌 一句话摘要 本文介绍了一款名为 FreeUltraCode 的本地桌面工具,通过统一管理 20+ 免费/低成本大模型渠道,并利用工作流编排与智能路由,实现用廉价模型集群达到接近 Claude Code 等高端工具的编程质量。 📝 详细摘要 作者是一名有十几年经验的游戏开发者,因 Claude
📅 2026-06-06 08:49 (2 天前) hotoh521 人工智能 2 分鐘 ★ 87
AI 编程 LLM AI Agent 开发者工具
微软推出 MDASH,用于大规模 AI 漏洞研究
📌 一句话摘要 微软推出多模型代理安全平台 MDASH,整合 100 多个专业 AI 代理,用于对 Windows 等大型代码库进行自动化漏洞审计,在基准测试中取得 88.45% 的得分。 📝 详细摘要 本文报道了微软推出的 AI 驱动漏洞发现系统 MDASH。该系统是一个多模型代理安全平台,整
📅 2026-06-05 14:30 (3 天前) InfoQ 中文 人工智能 2 分鐘 ★ 82
AI 安全 LLM AI Agent 漏洞发现