DeepSeek V4 还能更省！新工具缓存命中率高达 99.82%，2 折稳定到手

📌 一句话摘要

开源项目 Reasonix 专为 DeepSeek V4 打造，通过 append-only 缓存循环设计实现 99.82% 缓存命中率，将 API 调用成本降至 2 折。

📝 详细摘要

文章介绍了开源项目 Reasonix，这是一个专为 DeepSeek V4 系列模型设计的终端编码工具（coding harness），核心目标是降低长会话的 API 调用成本。Reasonix 通过基于字节稳定 prefix-cache 的 append-only 运行循环设计，将上下文划分为固定前缀区、历史消息区和草稿区，确保旧上下文固定不动、新消息只追加不重写，从而将缓存命中率提升至 99.82%。文章详细拆解了其架构的三个核心部分：自动前缀缓存机制、工具调用修复（Tool-Call Repair）流程、以及智能模型切换策略（默认使用 v4 flash，困难任务自动切换 v4 pro）。此外，文章还介绍了安装使用的简便性（npx reasonix code 即可运行），并收录了社区讨论中的不同声音，包括对是否真的需要专用 Agent 的质疑。

💡 主要观点

- Reasonix 通过 append-only 缓存循环设计实现 99.82% 缓存命中率。 项目将上下文划分为固定前缀区、历史消息区和草稿区，确保旧上下文固定不动、新消息只追加不重写，从而最大化字节级 prefix-cache 的命中率，将长会话成本降至 2 折。

工具调用修复机制解决 DeepSeek 常见问题。 针对 DeepSeek 模型常见的工具调用 JSON 消失、参数畸形、重复调用风暴和 JSON 截断等问题，Reasonix 设计了 4 轮修复流程，在真正执行前先尝试修复这些问题。

智能模型切换策略平衡成本与性能。 默认优先使用便宜的 v4 flash 模型，困难任务可通过 /pro 命令或失败信号自动切换为 v4 pro，跑完后自动切回便宜模型，无需用户手动操作。

💬 文章金句

- Reasonix 是一款专为 DeepSeek 打造的终端 coding harness，核心目的就是省钱——长会话能把缓存命中保持在 90%+，输入 token 成本降到 1/5。

Reasonix 只为 DeepSeek 打造，每一个抽象层级都基于 DeepSeek 的 Feature 构建，完全不通用，也不会发布通用功能。
旧的上下文固定不动，新消息只往后追加，尽量保证每一轮请求的前半部分完全一样，从而提高缓存命中率，降低长会话成本。

📊 文章信息

AI 初评：83

来源：量子位

作者：鱼羊

分类：人工智能

语言：中文

阅读时间：7 分钟

字数：1546

标签： DeepSeek V4, Reasonix, 缓存优化, AI 编程, 成本优化

阅读完整文章

DeepSeek V4 还能更省！新工具缓存命中率高达 99.82%，2 折稳定到手

🤖 問 AI