← 回總覽

DeepSeek V4 还能更省!新工具缓存命中率高达 99.82%,2 折稳定到手

📅 2026-05-25 12:40 鱼羊 人工智能 2 分鐘 1473 字 評分: 83
DeepSeek V4 Reasonix 缓存优化 AI 编程 成本优化
📌 一句话摘要 开源项目 Reasonix 专为 DeepSeek V4 打造,通过 append-only 缓存循环设计实现 99.82% 缓存命中率,将 API 调用成本降至 2 折。 📝 详细摘要 文章介绍了开源项目 Reasonix,这是一个专为 DeepSeek V4 系列模型设计的终端编码工具(coding harness),核心目标是降低长会话的 API 调用成本。Reasonix 通过基于字节稳定 prefix-cache 的 append-only 运行循环设计,将上下文划分为固定前缀区、历史消息区和草稿区,确保旧上下文固定不动、新消息只追加不重写,从而将缓存命中率提升至

📌 一句话摘要

开源项目 Reasonix 专为 DeepSeek V4 打造,通过 append-only 缓存循环设计实现 99.82% 缓存命中率,将 API 调用成本降至 2 折。

📝 详细摘要

文章介绍了开源项目 Reasonix,这是一个专为 DeepSeek V4 系列模型设计的终端编码工具(coding harness),核心目标是降低长会话的 API 调用成本。Reasonix 通过基于字节稳定 prefix-cache 的 append-only 运行循环设计,将上下文划分为固定前缀区、历史消息区和草稿区,确保旧上下文固定不动、新消息只追加不重写,从而将缓存命中率提升至 99.82%。文章详细拆解了其架构的三个核心部分:自动前缀缓存机制、工具调用修复(Tool-Call Repair)流程、以及智能模型切换策略(默认使用 v4 flash,困难任务自动切换 v4 pro)。此外,文章还介绍了安装使用的简便性(npx reasonix code 即可运行),并收录了社区讨论中的不同声音,包括对是否真的需要专用 Agent 的质疑。

💡 主要观点

- Reasonix 通过 append-only 缓存循环设计实现 99.82% 缓存命中率。 项目将上下文划分为固定前缀区、历史消息区和草稿区,确保旧上下文固定不动、新消息只追加不重写,从而最大化字节级 prefix-cache 的命中率,将长会话成本降至 2 折。

工具调用修复机制解决 DeepSeek 常见问题。 针对 DeepSeek 模型常见的工具调用 JSON 消失、参数畸形、重复调用风暴和 JSON 截断等问题,Reasonix 设计了 4 轮修复流程,在真正执行前先尝试修复这些问题。
智能模型切换策略平衡成本与性能。 默认优先使用便宜的 v4 flash 模型,困难任务可通过 /pro 命令或失败信号自动切换为 v4 pro,跑完后自动切回便宜模型,无需用户手动操作。

💬 文章金句

- Reasonix 是一款专为 DeepSeek 打造的终端 coding harness,核心目的就是省钱——长会话能把缓存命中保持在 90%+,输入 token 成本降到 1/5。

  • Reasonix 只为 DeepSeek 打造,每一个抽象层级都基于 DeepSeek 的 Feature 构建,完全不通用,也不会发布通用功能。
  • 旧的上下文固定不动,新消息只往后追加,尽量保证每一轮请求的前半部分完全一样,从而提高缓存命中率,降低长会话成本。

📊 文章信息

AI 初评:83

来源:量子位

作者:鱼羊

分类:人工智能

语言:中文

阅读时间:7 分钟

字数:1546

标签: DeepSeek V4, Reasonix, 缓存优化, AI 编程, 成本优化

阅读完整文章

查看原文 → 發佈: 2026-05-25 12:40:14 收錄: 2026-05-25 14:00:44

🤖 問 AI

針對這篇文章提問,AI 會根據文章內容回答。按 Ctrl+Enter 送出。