全部 未讀 (21557) ★ 收藏 (0) 🤖 人工智能 (11159) 📊 商业科技 (4458) 💻 软件编程 (1684) 📁 个人成长 (1603) 📁 生活文化 (850) 📁 媒体资讯 (797) 📁 投资财经 (526) 🎨 产品设计 (406) 📁 AI 产品 (39) 📁 体育运动 (27)
篩選中: 🏷️ Token 优化 共 46 篇 ✕ 清除篩選
21559
全部文章
21557
未讀
146
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (06-08 16:00)
BestBlogs 精選 (21524)

🏷️ 熱門標籤

AI Agent 2149 AI 编程 983 Anthropic 981 Claude Code 916 AI 智能体 780 OpenAI 745 LLM 672 开源 574 OpenClaw 557 Claude 557 AI 517 AI 安全 490 开发者工具 432 Codex 416 软件工程 398 具身智能 334 Agent 334 个人成长 328 GitHub 321 生产力 315
5 个月“救回”2000 亿 Token!被 AI 账单吓到,Netflix 大佬开源「Token 瘦身器」:砍掉 90%无效 Token,狂省 70 万美元!
📌 一句话摘要 Netflix 高级工程师 Tejas Chopra 开源了 Token 压缩工具 Headroom,通过可逆压缩技术砍掉最高 90% 的无效 Token,已帮助用户节省约 70 万美元成本并释放超 2000 亿 Token 配额。 📝 详细摘要 本文编译自 The Regist
📅 2026-06-04 15:16 (4 天前) CSDN 人工智能 2 分鐘 ★ 82
AI 编程 LLM Token 优化 开源项目
Token 在燃烧?Uber4 个月烧完全年 AI 预算!当大厂开始集体算账,开发者的真实账单藏不住了
📌 一句话摘要 本文以 Uber 烧光全年 AI 预算为引,揭示大厂 AI 投入产出失衡的现状,并为开发者提供了具体的 Token 成本优化策略。 📝 详细摘要 文章从 Uber CTO 透露其 2026 年全年 Claude Code 预算在 4 月就已烧光这一事件切入,揭示了当前大厂在 AI
📅 2026-06-01 17:52 (7 天前) 51CTO技术栈 人工智能 2 分鐘 ★ 86
AI 成本 Token 优化 AI 编码 Claude Code
Claude Prompt Caching 精读笔记
📌 一句话摘要 池建强分享了一篇关于 Claude Prompt Caching 的精读笔记,深入解读了官方文档中的基础理论和最佳实践。 📝 详细摘要 这条推文分享了一篇关于 Claude Prompt Caching 的精读笔记。作者阅读了 Claude 官方文档,深入理解了 Prompt C
📅 2026-05-31 20:15 (7 天前) 池建强 人工智能 1 分鐘 ★ 82
Claude Prompt Caching AI 开发 最佳实践
AI Agent 高 Token 消耗的解决方案:用 Skill + Script 替代 Memory
📌 一句话摘要 针对 AI Agent 接入数据库后 Token 消耗大的问题,建议用 Agent Skill + Script 替代 Memory 中的工作流,让 LLM 只负责翻译自然语言为 SQL,确定性步骤由脚本执行。 📝 详细摘要 这条推文以问答形式,深入探讨了 AI Agent 接入
📅 2026-05-30 09:48 (9 天前) 宝玉 人工智能 1 分鐘 ★ 88
AI Agent Token 优化 Agent Skill SQL
避免大模型不必要的消耗:杜绝礼貌用语
📌 一句话摘要 作者分享了一个使用大模型的小技巧:避免说「你好」「谢谢」「可不可以」等礼貌用语,以减少不必要的 Token 消耗。 📝 详细摘要 作者提出一个实用观点:为了减少大模型的 Token 消耗,应该避免使用「你好」「谢谢」「可不可以」「再见」等礼貌用语。这反映了 AI 使用中的一个常见
📅 2026-05-29 10:20 (10 天前) 卫斯理 人工智能 1 分鐘 ★ 80
AI 使用技巧 Token 优化 提示词工程 效率
清华团队开源 Agent 系统 PilotDeck,Token 成本狂降 70%
📌 一句话摘要 清华团队开源 Agent 系统 PilotDeck,通过独立工作舱、白盒化记忆和智能路由,实现多任务并行、记忆可控和 Token 成本降低 70%。 📝 详细摘要 文章介绍了由清华大学 THUNLP 实验室、面壁智能、OpenBMB 与 AI9stars 联合研发并开源的 Age
📅 2026-05-28 12:38 (11 天前) 新智元 人工智能 2 分鐘 ★ 84
PilotDeck Agent 开源 Token 优化
腾讯 Agent Memory 方案:上下文卸载与 Mermaid 无限画布解决长任务上下文腐烂
📌 一句话摘要 腾讯技术工程团队提出通过上下文卸载和 Mermaid 任务画布的组合方案,解决 Agent 在长任务中因上下文信息冗余导致的性能下降问题,最高节省 61% Token 并提升任务通过率。 📝 详细摘要 这是一篇对腾讯技术工程团队文章的深度解读 Thread。文章核心问题是 Age
📅 2026-05-28 16:47 (11 天前) ginobefun 人工智能 1 分鐘 ★ 85
Agent Memory 上下文卸载 Mermaid Token 优化
腾讯 Agent Memory 方案摘要:Mermaid 无限画布 × 上下文卸载节省 61% Token
📌 一句话摘要 作为 Thread 的后续推文,以 #BestBlogs 标签形式发布了腾讯 Agent Memory 方案的摘要,包含核心要点和文章链接。 📝 详细摘要 这是 Thread 的第三条推文,以 #BestBlogs 标签形式对前文解读的腾讯文章进行了结构化摘要。内容包含文章的核心
📅 2026-05-28 16:48 (11 天前) ginobefun 人工智能 1 分鐘 ★ 76
BestBlogs Agent Memory Mermaid 腾讯
腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍:Mermaid 无限画布×上下文卸载
📌 一句话摘要 腾讯云 Agent Memory 通过上下文卸载与 Mermaid 无限画布的组合方案,在超长 Session 中最高节省 61% Token 并提升 52% 任务通过率,实现了 Agent 短期记忆的高效压缩与结构化管理。 📝 详细摘要 本文由腾讯技术工程团队发布,详细介绍了
📅 2026-05-22 17:36 (17 天前) 腾讯技术工程 人工智能 2 分鐘 ★ 91
Agent Memory 上下文卸载 Mermaid 短期记忆压缩
LLM 应用层产物形态三步走:chat → agent → 应用固化
📌 一句话摘要 KroWork 提出 LLM 应用层第三步是「应用固化」,将会话编译为本地可执行 App,后续运行不再消耗 token。 📝 详细摘要 该推文提出了一个关于 LLM 应用层产物形态演进的框架:从 chat(输出 text)到 agent(输出 execution trace),再
📅 2026-05-18 08:31 (21 天前) meng shao 人工智能 1 分鐘 ★ 82
LLM 应用 Agent 应用固化 KroWork
腾讯开源 Agent 记忆技术方案,Token 消耗最高降低 61%
📌 一句话摘要 腾讯开源 TencentDB Agent Memory,通过 Mermaid 任务画布和上下文卸载技术,在长任务场景中最高降低 61% Token 消耗并提升 51% 任务成功率。 📝 详细摘要 腾讯云数据库团队正式开源 TencentDB Agent Memory,这是一套针对
📅 2026-05-14 16:34 (25 天前) 鱼羊 人工智能 2 分鐘 ★ 86
Agent 记忆压缩 Token 优化 腾讯云
省 Token 还能提高 Coding Agent 效率
📌 一句话摘要 池建强评论被引推文观点,指出做好会话管理不仅能节省 Token,还能提升模型和 Agent 工具的智能表现。 📝 详细摘要 这是一条评论性推文,引用了一篇关于在 1M 上下文时代使用 Coding Agent 省钱计划的文章。被引文章详细解释了 1M 上下文的概念,指出在 Cla
📅 2026-05-02 08:55 (05-02 08:55) 池建强 人工智能 1 分鐘 ★ 78
Coding Agent 上下文管理 Token 优化 Claude Code
通用 AI Agent 驱动网关路由安全审计实践|得物技术
📌 一句话摘要 得物技术团队分享了基于通用 AI Agent 构建网关路由安全审计系统的实践,通过分层架构、Token 成本优化和人机协同模式,实现了大规模 API 越权漏洞的全量自动化检测。 📝 详细摘要 本文详细介绍了得物技术团队在网关路由安全审计领域的 AI 驱动实践。面对 API 规模扩
📅 2026-04-29 18:30 (04-29 18:30) 得物技术 人工智能 2 分鐘 ★ 88
AI Agent 安全审计 网关路由 越权漏洞
Skills 驱动推理新范式,清华&北大:Token 立省 59%,准确率不降反升
📌 一句话摘要 清华和北大等机构提出的 TRS 框架,通过将推理轨迹蒸馏为可复用的技能卡片,在推理时检索注入,实现了在数学和编程任务上减少 Token 消耗的同时提升准确率。 📝 详细摘要 本文介绍了由奇元科技、清华大学和北京大学等机构提出的 TRS(Thinking with Reasonin
📅 2026-04-29 16:22 (04-29 16:22) PaperAgent 人工智能 1 分鐘 ★ 86
TRS 推理模型 技能卡片 Token 优化
OpenWolf:给 Claude Code 装上「第二大脑」,平均节省 65% Token 用量
📌 一句话摘要 OpenWolf 通过 6 个钩子脚本为 Claude Code 提供项目文件地图、重复读取拦截、错误记忆和 bug 记忆库,平均节省 65% 的 token 消耗。 📝 详细摘要 该推文介绍了一个名为 OpenWolf 的开源工具,旨在解决 Claude Code 在开发过程中
📅 2026-04-27 12:00 (04-27 12:00) GitHubDaily 人工智能 1 分鐘 ★ 85
Claude Code OpenWolf Token 优化 AI 编程工具
刚刚!Generic Agent 中文教程发布!比 Hermes 省 10 倍 Token
📌 一句话摘要 Datawhale 团队发布了 Generic Agent 中文教程,详细介绍了这个极简自主 Agent 框架的核心原理、安装部署和最佳实践,其核心优势在于通过上下文信息密度最大化原则,相比同类框架可节省约 10 倍 Token 消耗。 📝 详细摘要 本文是 Datawhale
📅 2026-04-23 22:02 (04-23 22:02) Datawhale 人工智能 2 分鐘 ★ 85
Generic Agent Agent 框架 Token 优化 Harness Engineering
千万养虾人的终极梦想!全球首个「养虾本」带你懒人养虾开箱即食
📌 一句话摘要 荣耀发布全球首款「养虾本」MagicBook 系列,通过出厂预置 YOYO Claw 龙虾技术,实现开箱即用的 AI 智能体体验,并宣称综合 Token 消耗较 OpenClaw 节省 50%。 📝 详细摘要 本文是机器之心对荣耀 YOYO Claw 龙虾技术的深度报道。文章指出
📅 2026-04-22 11:30 (04-22 11:30) 机器之心 人工智能 2 分鐘 ★ 86
荣耀 YOYO Claw 养虾本 AI 智能体
10 个 GitHub 仓库助你节省 Claude Code 60–90% 的 tokens
📌 一句话摘要 推荐 10 个 GitHub 仓库,旨在帮助开发者在使用 Claude Code 时大幅减少 60–90% 的 token 消耗。 📝 详细摘要 这条推文提出了一个开发者普遍关心的问题:如何在使用 Claude Code 时节省 token 成本。它通过推荐 10 个相关的 Gi
📅 2026-04-20 15:13 (04-20 15:13) AI Will 人工智能 1 分鐘 ★ 78
Claude Code Token 优化 GitHub AI 编程
TW 使用 Claude 节省 40% Token 的技巧
📌 一句话摘要 分享一个通过设置环境变量 `CLAUDE_CODE_AUTO_COMPACT_WINDOW` 来优化 Claude Code 使用、节省 Token 的技巧。 📝 详细摘要 这条推文分享了一个针对 Claude Code(Claude 的代码编辑器)的使用技巧。通过设置 `CLA
📅 2026-04-19 06:24 (04-19 06:24) Berryxia.AI 人工智能 1 分鐘 ★ 83
Claude Token 优化 命令行技巧 AI 编程
10 个开源项目助你在 Claude Code 中节省 60-90% Token
📌 一句话摘要 详细汇总了 10 个旨在优化 Claude Code 使用、大幅节省 Token 消耗的开源 GitHub 仓库,并提供了组合使用建议。 📝 详细摘要 这是一条信息密度极高的资源整合推文。作者系统性地整理了 10 个专门用于在 Claude Code 中节省 Token 消耗的开
📅 2026-04-19 07:07 (04-19 07:07) Berryxia.AI 人工智能 1 分鐘 ★ 88
Claude Code Token 优化 开源工具 MCP