全部 未讀 (21636) ★ 收藏 (0) 🤖 人工智能 (11175) 📊 商业科技 (4465) 💻 软件编程 (1685) 📁 个人成长 (1606) 📁 生活文化 (860) 📁 媒体资讯 (828) 📁 投资财经 (533) 🎨 产品设计 (409) 📁 AI 产品 (39) 📁 体育运动 (28)
篩選中: 🏷️ 上下文 共 260 篇 ✕ 清除篩選
21638
全部文章
21636
未讀
225
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-08 22:00)
BestBlogs 精選 (21603)

🏷️ 熱門標籤

AI Agent 2161 AI 编程 988 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 677 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 399 具身智能 335 Agent 334 个人成长 333 GitHub 321 生产力 315
你的 Agent 每次都“失忆”?这个工具彻底治好了我的前端开发焦虑
📌 一句话摘要 OpenViking 是一个以 MCP 协议为核心的 Agent 记忆中枢,通过结构化记忆提取、意图分析与层级检索,解决跨会话、跨 Agent、跨平台的前端开发上下文断裂问题。 📝 详细摘要 本文由字节跳动技术团队发布,介绍其开源的 Agent 记忆管理工具 OpenViking
📅 2026-06-08 17:08 (6 小時前) 字节跳动技术团队 人工智能 2 分鐘 ★ 87
AI Agent MCP 协议 AI 编程 上下文工程
横向拆解 Claude Code、Codex 等六大 Agent 上下文压缩策略后,我们做了第 7 个
📌 一句话摘要 本文横向拆解 Claude Code、Codex CLI 等六大 Agent 的上下文压缩策略,提炼出分层渐进、成本递增、增量摘要等共识原则,并介绍了作者团队面向云端多用户场景落地的四级水位线方案及存储分离、跨轮缓存等特化设计。 📝 详细摘要 文章首先横向对比了 Claude C
📅 2026-06-08 17:36 (5 小時前) 腾讯技术工程 人工智能 2 分鐘 ★ 91
AI Agent 上下文工程 LLM AI 编程
95%的开发者都在用错 AI Agent——一份 Hermes 实战指南
📌 一句话摘要 本文深度拆解 Hermes AI Agent 的 12 个高阶功能,从持久化架构到多平台分发,揭示 95% 用户仅停留在表层使用,并提供实战配置建议。 📝 详细摘要 文章基于一篇引爆技术社区的分析,系统拆解了开源 AI Agent Hermes 的 12 个结构性高级功能。作者将
📅 2026-06-06 00:00 (2 天前) 王俊博客 人工智能 2 分鐘 ★ 88
AI Agent AI 编程 上下文工程 开发者工具
模型也需要「睡觉」?CMU 新论文让 LLM 在梦中「巩固记忆」
📌 一句话摘要 CMU 新论文提出一种类似睡眠的「记忆巩固机制」,让 LLM 在离线阶段递归处理上下文,将关键信息转化为快速权重,以提升长程推理能力。 📝 详细摘要 文章介绍了卡内基梅隆大学与马里兰大学等机构联合发表的一篇论文《Language Models Need Sleep》。论文指出,随
📅 2026-06-05 12:07 (3 天前) 机器之心 人工智能 2 分鐘 ★ 82
LLM AI 研究 长上下文 记忆机制
首字延迟降低 3.6 倍,腾讯混元提出 Stem 稀疏注意力算法,长文推理加速新 SOTA
📌 一句话摘要 腾讯混元提出 Stem 稀疏注意力算法,通过 Token 位置衰减和输出感知度量两大创新,在仅用 25% 算力下逼近稠密注意力精度,配合 HPC 算子实现 128K 上下文首字延迟降低 3.7 倍,被 ICML 2026 收录。 📝 详细摘要 本文详细介绍了腾讯混元团队提出的 S
📅 2026-06-05 19:23 (3 天前) 腾讯混元 人工智能 2 分鐘 ★ 90
LLM AI 推理 稀疏注意力 模型加速
【第 3710 期】智能体驱动框架的解剖与推演
📌 一句话摘要 本文系统性地定义了智能体驱动框架的概念,从模型能力边界出发,推导出文件系统、代码执行、沙箱、记忆与上下文管理等核心组件的设计逻辑,并展望了模型与驱动框架协同进化的未来。 📝 详细摘要 文章首先提出核心观点:智能体 = 模型 + 驱动框架。模型提供智能,驱动框架(包括系统提示词、工
📅 2026-06-03 09:05 (5 天前) 前端早读课 人工智能 2 分鐘 ★ 88
AI Agent LLM AI 编程 驱动框架
Codex App 隐藏上下文用量,新版本需手动开启
📌 一句话摘要 Codex App 曾隐藏上下文用量显示,新版本虽已加回但需用户主动在设置中开启,引发用户不满。 📝 详细摘要 这条推文吐槽了 Codex App 的产品设计决策。作者指出,该应用在上一个版本中移除了上下文用量显示,而在新版本中虽然重新加入,却默认关闭,需要用户手动在设置中开启。
📅 2026-05-30 11:05 (9 天前) 宝玉 人工智能 1 分鐘 ★ 76
Codex AI编程 上下文窗口 产品设计
Cursor 开发者报告关键数据解读:AI 代码产出差距扩大、上下文理解成本上升
📌 一句话摘要 博主解读 Cursor 开发者报告,指出头部用户与普通用户的 AI 代码产出差距持续扩大,AI 理解代码库的成本(input/output token ratio)大幅上升,以及开发者对 AI 代码的信任度增加,手动审核减少。 📝 详细摘要 该推文对 Cursor 官方发布的开发
📅 2026-05-29 19:03 (10 天前) 歸藏(guizang.ai) 人工智能 1 分鐘 ★ 85
Cursor AI 编程 开发者报告 AI 代码生成
超越 TurboQuant,面向长上下文推理的真 2-bit KV Quantization 算法问世
📌 一句话摘要 TogetherAI 联合悉尼大学和 UIUC 提出 OSCAR 算法,通过 attention-aware 旋转和离线校准,在约 2.28 有效比特下实现接近 BF16 精度的 2-bit KV Cache 量化,并已集成至 SGLang 推理框架实现开箱即用。 📝 详细摘要
📅 2026-05-29 12:04 (10 天前) 机器之心 人工智能 2 分鐘 ★ 88
KV Cache 量化 长上下文 SGLang
超越 TurboQuant! OSCAR:面向真实 Serving 的 2bit KV Cache 量化
📌 一句话摘要 OSCAR 提出了一种面向真实长上下文推理服务的近 2-bit KV Cache 量化方案,通过 attention-aware 旋转和离线校准,在保持模型精度的同时实现约 8 倍显存压缩和最高 7 倍吞吐提升,并已接入 SGLang 服务框架。 📝 详细摘要 本文详细介绍了 O
📅 2026-05-29 14:00 (10 天前) InfoQ 中文 人工智能 2 分鐘 ★ 88
KV Cache 量化 模型推理优化 低比特量化 长上下文
真实 Agent 迭代案例,真正理解 Harness 工程
📌 一句话摘要 本文通过一个写作 Agent 的七层迭代案例,系统演示了 Harness 工程的核心策略,帮助 AI 产品经理理解如何将概念转化为可落地的工程实践。 📝 详细摘要 文章以「如何设计一个写作 Agent」为模拟场景,从最基础的 Agent 配置开始,逐层叠加 Harness 工程策
📅 2026-05-29 07:45 (10 天前) 人人都是产品经理 人工智能 2 分鐘 ★ 87
Harness 工程 AI Agent 写作 Agent 产品经理
腾讯 Agent Memory 方案:上下文卸载与 Mermaid 无限画布解决长任务上下文腐烂
📌 一句话摘要 腾讯技术工程团队提出通过上下文卸载和 Mermaid 任务画布的组合方案,解决 Agent 在长任务中因上下文信息冗余导致的性能下降问题,最高节省 61% Token 并提升任务通过率。 📝 详细摘要 这是一篇对腾讯技术工程团队文章的深度解读 Thread。文章核心问题是 Age
📅 2026-05-28 16:47 (11 天前) ginobefun 人工智能 1 分鐘 ★ 85
Agent Memory 上下文卸载 Mermaid Token 优化
Agent 团队是伪命题:核心在于上下文工程
📌 一句话摘要 作者认为当前流行的多角色 AI Agent 团队设计没有实际价值,真正重要的是将任务背景、目标、约束等结构化上下文输入 LLM。 📝 详细摘要 这是一条有独立观点的技术评论推文。作者批评了当前流行的「AI Agent 团队」概念——即给 AI 设定产品经理、前端工程师、后端工程师
📅 2026-05-28 08:06 (11 天前) Mr Panda 人工智能 1 分鐘 ★ 78
AI Agent LLM 上下文工程 Prompt Engineering
深度解析:为什么 Agent 团队是伪命题,上下文工程才是关键
📌 一句话摘要 作者以 Thread 形式详细阐述了为什么多角色 AI Agent 团队设计无效,并系统论证了结构化上下文输入 LLM 才是更有效的方法。 📝 详细摘要 这是一条深度技术评论 Thread,作者对「AI Agent 团队」概念进行了系统性的批判和分析。文章首先描述了当前流行的做法
📅 2026-05-28 08:10 (11 天前) Mr Panda 人工智能 1 分鐘 ★ 82
AI Agent LLM 上下文工程 Prompt Engineering
讯飞×小红书:两位工程实践者的 Agent 对谈 | 极客有约
📌 一句话摘要 本文预告了一场关于 Agent 工程化核心挑战的直播对谈,聚焦运行时底座与上下文治理两大关键问题,邀请讯飞和小红书的一线工程师分享实战经验与踩坑教训。 📝 详细摘要 本文是「极客有约」栏目对一场直播活动的预告。直播主题为「Agent 能用,为什么还是不好用?」,邀请科大讯飞高级系
📅 2026-05-27 13:18 (12 天前) AI前线 人工智能 1 分鐘 ★ 75
Agent 工程化 运行时底座 上下文治理
大模型也需要「睡觉」:CMU 和 UMD 提出 Sleep-like Consolidation 机制
📌 一句话摘要 CMU 和 UMD 研究团队发现 Transformer 在处理超长任务时注意力机制失效,并提出让模型「睡觉」来巩固记忆的新范式。 📝 详细摘要 这是一篇对 arXiv 论文《Language Models Need Sleep》的详细介绍。作者指出,CMU 和 UMD 的研究团
📅 2026-05-26 22:50 (13 天前) Berryxia.AI 人工智能 1 分鐘 ★ 82
Transformer 长上下文 Sleep-like Consolidation CMU
深度解析:大模型为何需要「睡觉」来巩固记忆
📌 一句话摘要 作者结合自身使用大模型进行深度推理的体验,深入解读了 CMU 和 UMD 的论文,认为「睡眠」机制是解决模型记忆和长上下文推理问题的关键。 📝 详细摘要 这是一篇深度 Thread,作者结合自身使用大模型处理长合同和代码库的体验,指出模型在多跳推理和串联信息时容易「犯糊涂」。他深
📅 2026-05-26 23:14 (13 天前) Berryxia.AI 人工智能 1 分鐘 ★ 85
Transformer 长上下文 记忆巩固 Sleep-like Consolidation
MiniMax M3 模型预告:基于动态块稀疏注意力的长上下文新架构
📌 一句话摘要 MiniMax 预告了 M3 模型,其核心架构基于 GQA 的动态块稀疏注意力,在 1M token 上下文上速度提升显著。 📝 详细摘要 作者根据 MiniMax AI 工程负责人 Skyler Miao 的预告,介绍了即将发布的 M3 模型。M3 的核心架构是基于 GQA 的
📅 2026-05-27 08:24 (12 天前) Berryxia.AI 人工智能 1 分鐘 ★ 85
MiniMax M3 稀疏注意力 长上下文
Agent 系统工程早报:Anthropic 隔离架构、阿里 AgentScope 2.0、腾讯云上下文卸载
📌 一句话摘要 本期早报聚焦 Agent 系统工程的三个关键实践:Anthropic 的三种隔离架构、阿里 AgentScope 2.0 的生产级调试能力、以及腾讯云通过上下文卸载将 Token 消耗降低 60%。 📝 详细摘要 这是一篇 #BestBlogs 早报,聚焦 Agent 系统工程的
📅 2026-05-27 07:11 (12 天前) ginobefun 人工智能 1 分鐘 ★ 85
Agent 系统工程 Anthropic AgentScope 腾讯云
Gemini 负责人:你只用了 Gemini 真正能力的 5%丨 Silicon Valley Girl
📌 一句话摘要 Google Gemini 负责人 Josh Woodward 在访谈中阐述了 AI 正从工具向 Agent 演进,知识工作者将从「做事」转向「指挥」,个人上下文和工具直觉将成为新的核心竞争力。 📝 详细摘要 本文是对 Google Gemini 负责人 Josh Woodwar
📅 2026-05-26 20:29 (13 天前) 晚点再听LaterCast 人工智能 2 分鐘 ★ 86
Gemini AI Agent Google I/O 知识工作