全部 未讀 (11783) ★ 收藏 (0) 🤖 人工智能 (7568) 📊 商业科技 (1784) 💻 软件编程 (1196) 📁 个人成长 (735) 🎨 产品设计 (208) 📁 生活文化 (108) 📁 投资财经 (71) 📁 媒体资讯 (69) 📁 AI 产品 (39) 📁 AI (5)
篩選中: 🏷️ 缓存 共 20 篇 ✕ 清除篩選
11785
全部文章
11783
未讀
102
今日新增
0
收藏
📡 Poller 最後抓取: 1 小時前 (04-16 12:00)
BestBlogs 精選 (11766)

🏷️ 熱門標籤

AI Agent 1319 AI 智能体 732 Claude Code 643 Anthropic 621 LLM 563 OpenClaw 498 AI 编程 497 开源 438 AI 396 AI 安全 395 Claude 381 OpenAI 362 软件工程 354 开发者工具 341 生产力 308 GitHub 249 自动化 238 AI 基础设施 227 AI 开发 224 MCP 223
大规模替换数据库序列,保障百余个服务平稳运行
📌 一句话摘要 本文分享了 Coupang 在从关系型数据库迁移到 NoSQL 过程中,为替换原生数据库序列功能,基于 DynamoDB 和双层缓存架构构建高可用、低延迟序列服务的完整设计思路与实践经验。 📝 详细摘要 文章详细介绍了 Coupang 在淘汰遗留数据库、转向云原生基础设施时,如何
📅 2026-04-14 12:12 (2 天前) InfoQ 中文 软件编程 2 分鐘 ★ 92
数据库迁移 序列生成 DynamoDB 分布式系统
Anthropic 工程师详解 Claude Code 缓存策略与“遥测门”真相
📌 一句话摘要 针对开发者关于关闭遥测导致 Claude Code 提示缓存时间缩短的指控,Anthropic 工程师 Boris Cherny 详细解释了缓存策略的复杂性和技术原因。 📝 详细摘要 这条推文深度解读了 Claude Code 近期的一个技术争议。开发者 Can Vardar 发
📅 2026-04-14 01:07 (2 天前) 宝玉 人工智能 1 分鐘 ★ 88
Claude Code Anthropic 提示缓存 遥测
你有没有发现:PostgreSQL 可以做到 Redis 能做的一切
📌 一句话摘要 本文基于作者实践经验,详细阐述了如何利用 PostgreSQL 的 UNLOGGED 表、LISTEN/NOTIFY、SKIP LOCKED 等原生特性,替代 Redis 实现缓存、发布订阅、任务队列、会话存储等功能,并分析了其成本、运维简化、数据一致性优势以及适用场景。 📝 详
📅 2026-04-13 07:16 (3 天前) dbaplus社群 软件编程 2 分鐘 ★ 88
PostgreSQL Redis 数据库 缓存
Cloudflare 与苏黎世联邦理工学院概述 AI 驱动的缓存优化方案
📌 一句话摘要 Cloudflare 与苏黎世联邦理工学院提出 AI 感知缓存策略,以应对高频、独特的 AI 爬虫流量带来的运营挑战和缓存抖动问题。 📝 详细摘要 Cloudflare 工程师与苏黎世联邦理工学院的研究人员发现,AI 驱动的爬虫流量每周已超过 100 亿次请求,这从根本上打破了传
📅 2026-04-08 22:20 (7 天前) Leela Kumili 软件编程 1 分鐘 ★ 88
CDN 缓存策略 AI 爬虫 RAG
机械同理心原则
📌 一句话摘要 本文阐述了“机械同理心”原则,展示了如何通过将软件设计与内存层级和缓存行等硬件现实相匹配,从而显著提升系统性能。 📝 详细摘要 本文介绍了“机械同理心”(Mechanical Sympathy)——这一术语借用自赛车运动,用于描述构建高性能软件所需的对硬件的深刻理解。文章详细阐述
📅 2026-04-07 21:39 (8 天前) Martin Fowler 软件编程 10 分鐘 ★ 92
机械同理心 性能优化 CPU 缓存 并发
OpenClaw 2026.4.5 发布:新功能与模型支持
📌 一句话摘要 OpenClaw 发布 2026.4.5 版本,引入内置视频与音乐生成功能,上线“梦境 (dreaming)”记忆系统,并优化了提示词缓存复用。 📝 详细摘要 OpenClaw 发布了 2026.4.5 版本,带来了包括原生视频和音乐生成在内的重大更新。此次发布引入了名为“梦境
📅 2026-04-06 11:42 (10 天前) OpenClaw🦞 人工智能 1 分鐘 ★ 86
OpenClaw AI 工具 版本发布 生成式 AI
OpenClaw 更新:提示词缓存效率与 API 成本优化
📌 一句话摘要 Peter Steinberger 介绍了 OpenClaw 的更新,通过提升提示词缓存效率来降低 API 成本,并认可了相关方为缓解生态摩擦所做的努力。 📝 详细摘要 这条推文提供了 OpenClaw 项目的技术更新,重点关注旨在降低 API 用户成本的提示词缓存效率改进。通过
📅 2026-04-04 13:22 (12 天前) Peter Steinberger 🦞 人工智能 1 分鐘 ★ 82
OpenClaw API 优化 提示词缓存 AI 基础设施
在不破坏 100 多个服务的前提下,大规模替换数据库序列
📌 一句话摘要 Coupang 成功地用一套高可用的两层缓存分布式系统替换了遗留的数据库序列,该系统每秒处理 5 万次以上的请求,同时将数据库负载降至最低,并实现了完全的向后兼容。 📝 详细摘要 本文详细介绍了 Coupang 将 100 多个服务从关系型数据库迁移到 NoSQL 的工程历程,同
📅 2026-04-03 17:00 (12 天前) Saumya Tyagi 软件编程 25 分鐘 ★ 92
分布式系统 数据库迁移 系统架构 缓存策略
AI 缓存设置策略:5 分钟 vs 1 小时成本分析
📌 一句话摘要 探讨了 AI 工具中缓存过期时间设置的成本差异与适用场景,建议根据个人使用习惯进行选择。 📝 详细摘要 该推文引用了一段关于 AI 工具缓存设置的讨论。分析指出,5 分钟缓存价格更低,适合连续对话场景;1 小时缓存价格较高,但适合间隔较长的使用习惯。通过对比两种设置的成本与适用性
📅 2026-04-03 11:58 (13 天前) 宝玉 人工智能 1 分鐘 ★ 80
AI 工具 缓存策略 成本优化 使用技巧
为什么我们要为 AI 时代重新思考缓存机制
📌 一句话摘要 Cloudflare 正在重新设计 CDN 缓存架构,以缓解由 AI 爬虫独特的长尾访问模式所导致的破坏性缓存抖动。 📝 详细摘要 本文探讨了 AI 爬虫流量的激增如何从根本上挑战传统的 CDN 缓存策略。与人类用户不同,用于 RAG 和模型训练的 AI 机器人表现出激进、大容量
📅 2026-04-02 22:00 (13 天前) Avani Wildani 软件编程 2 分鐘 ★ 90
CDN 缓存算法 AI 爬虫 Cloudflare
针对编码智能体的缓存优化
📌 一句话摘要 Ollama 升级了缓存机制,以减少内存使用并提高智能体工作流的响应速度。 📝 详细摘要 Ollama 实施了缓存优化,包括智能检查点和更智能的驱逐策略。这些更改旨在减少内存利用率并提高共享系统提示词的缓存命中率,特别有利于编码智能体和多轮对话。 📊 文章信息 AI 评分:87
📅 2026-03-31 12:27 (16 天前) ollama 人工智能 1 分鐘 ★ 87
Ollama 缓存 智能体工作流 优化
Vercel CDN 现在默认遵循来自外部源站的 Cache-Control 响应头 - Vercel
📌 一句话摘要 从 2026 年 4 月 6 日起,Vercel 将默认自动遵循新项目中重写(rewrites)请求的外部源站 Cache-Control 响应头。 📝 详细摘要 Vercel 正在更新其 CDN 行为,以简化代理内容的缓存。此前,通过重写(rewrites)获取的外部源站响应默
📅 2026-03-31 08:02 (16 天前) Agustin Falco 软件编程 1 分鐘 ★ 82
Vercel CDN 缓存 Cache-Control
关于 AI 模型性能下降的技术假设
📌 一句话摘要 Antirez 指出,用户感知到的 AI 模型性能下降可能不仅仅是人类的主观偏差,也可能源于激进的 KV 缓存量化等技术变更。 📝 详细摘要 这条推文探讨了用户中普遍存在的认知——AI 模型似乎会随着时间推移而性能下降。虽然这通常被归因于人类的主观偏差,但作者提出了另一种技术层面
📅 2026-03-30 22:55 (16 天前) antirez 人工智能 1 分鐘 ★ 81
AI LLM KV 缓存 量化
Grab 工程实践:将 LRU 升级为 TLRU,Android 图片缓存节省 50MB+
📌 一句话摘要 Grab 工程师通过将 Glide 的 LRU 缓存机制升级为时间感知型 TLRU,在保证缓存命中率的前提下,成功为 Android 用户节省了 50MB 以上的存储空间。 📝 详细摘要 本文介绍了 Grab 在 Android 图片缓存优化方面的工程实践。针对原生 Glide
📅 2026-03-20 16:07 (26 天前) InfoQ 中文 软件编程 11 分鐘 ★ 83
Android 开发 缓存优化 LRU TLRU
Cloudflare Workers AI 深度解析:集成 Kimi K2.5 与基础设施优化
📌 一句话摘要 Cloudflare Workers AI 通过集成 Kimi K2.5 并引入前缀缓存和异步 API 等优化,为 AI 智能体提供高性能、高性价比的无服务器运行环境。 📝 详细摘要 该推文是对 Cloudflare 官方博客的深度解读。Cloudflare 将 Kimi K2.
📅 2026-03-20 11:30 (27 天前) 人工智能 1 分鐘 ★ 88
Cloudflare Workers AI Kimi K2.5 智能体 前缀缓存
为什么元数据是 S3/GCP/Azure 级存储中真正的瓶颈,以及缓存如何解决这一问题
📌 一句话摘要 本文深入探讨了大规模对象存储中管理元数据的架构策略,重点介绍了分层缓存、负缓存和一致性管理,旨在缓解瓶颈并保护系统免受流量激增和恶意攻击的影响。 📝 详细摘要 本文探讨了元数据在对象存储系统(如 S3、GCP 和 Azure)中的关键作用,指出元数据查找是互联网规模下的主要瓶颈。
📅 2026-03-19 14:34 (27 天前) Adwaita Chokshi 软件编程 1 分鐘 ★ 89
分布式系统 对象存储 系统架构 缓存策略
英伟达称其可在不改变模型权重的情况下将 LLM 记忆缩小 20 倍
📌 一句话摘要 英伟达研究人员推出了 KV 缓存变换编码(KVTC),这是一种非侵入式技术,它利用媒体压缩原理,将 LLM 记忆使用量减少 20 倍,并将初始响应时间加快 8 倍。 📝 详细摘要 英伟达发布了 KV 缓存变换编码(KVTC),这是一种旨在解决大型语言模型(LLM)推理中“记忆墙”
📅 2026-03-18 06:43 (29 天前) Ben Dickson 人工智能 9 分鐘 ★ 90
KV 缓存 LLM 推理 英伟达 模型压缩
AI 记忆赛道的终局判断与技术壁垒
📌 一句话摘要 预测 2026 年基础模型将聚焦记忆技术,并指出参数记忆与缓存优化的结合是核心壁垒。 📝 详细摘要 推文对 AI 记忆赛道给出了终局判断:2026 年基础模型的主旋律将围绕记忆展开。作者指出,真正的技术壁垒不在于简单的外部记忆层,而在于能同时处理“参数记忆”与“缓存优化”的能力。
📅 2026-03-16 12:02 (03-16 12:02) AI Will 人工智能 1 分鐘 ★ 85
AI记忆 参数记忆 缓存优化 技术壁垒
Grab 如何使用时间感知型 LRU 优化 Android 上的图像缓存
📌 一句话摘要 Grab 通过将 Glide 的 LRU 扩展为时间感知型 TLRU 设计,改进了 Android 图像缓存,显著回收了存储空间,同时将命中率影响控制在可接受范围内。 📝 详细摘要 本文解释了 Grab 如何解决固定大小 LRU 图像缓存中的两种相反的故障模式:对于重度用户而言的
📅 2026-03-15 04:00 (03-15 04:00) Sergio De Simone 软件编程 10 分鐘 ★ 88
Android 缓存 TLRU Glide
为什么要在乎 LLM 中的提示词缓存?
📌 一句话摘要 本文解释了提示词缓存如何通过在多个请求中重用预计算的 token 前缀来优化 LLM 性能和成本。 📝 详细摘要 本文对提示词缓存进行了技术深度探讨,这是一种旨在降低大语言模型(LLM)应用延迟和成本的机制。文章首先区分了 LLM 推理中计算密集型“预填充”阶段和内存密集型“解码
📅 2026-03-14 01:11 (03-14 01:11) Maria Mouschoutzi 人工智能 2 分鐘 ★ 78
提示词缓存 LLM 推理 KV 缓存 成本优化