瞄准DeepSeek V4，Reasonix工具实现99.8%缓存命中率，大幅降低长会话成本

DeepSeek V4模型系列发布后，其官方已宣布永久降价。然而，开源社区并未止步于此，一个名为Reasonix的项目通过创新方案，将DeepSeek V4的长会话缓存命中率提升至惊人的99.82%，显著降低了使用成本。这意味着原本价值61美元（约414元人民币）的4亿+token账单，现在可直降至12美元（约81元人民币），成本降低了近80%。

Reasonix是一款专为DeepSeek打造的终端编程助手（coding harness），其核心目标是为DeepSeek用户节省成本。它能使长会话的缓存命中率维持在90%以上，将输入token成本降低至原来的五分之一。

Reasonix的实现思路基于字节稳定的前缀缓存（prefix-cache）和“只追加”（append-only）的运行循环设计。其工作流程专门适配DeepSeek的缓存机制：固定历史上下文，新消息只往后追加，从而确保每次请求的前半部分保持一致，极大提高缓存命中率，有效降低长会话的成本。

其架构可分为三个核心组成部分：

缓存优先循环（Cache-First Loop）： 自动前缀缓存仅在当前请求的精确字节前缀与先前请求匹配时激活。为解决多数Agent循环在每次交互时重排序、重写或注入新时间戳的问题，Reasonix将上下文划分为三个区域：
- 前缀区： 固定内容，每个会话仅计算一次。
- 历史消息区： 只追加，不重写。
- 草稿区： 任何信息在归入日志前，都需通过“工具调用修复”进行提炼。
工具调用修复（Tool-Call Repair）： DeepSeek在使用中可能遇到工具调用JSON内部生成却在最终消息中消失、JSON参数畸形、同一工具反复调用参数相同（重复调用风暴）、以及JSON被截断等问题。Reasonix的工具调用修复机制会在真正执行前，通过四轮处理尝试修复这些问题。
成本控制：
- 默认优先使用更经济的v4 flash模型，仅在遇到困难任务时自动切换到v4 pro。
- 每个轮次结束后自动压缩上下文。
- 用户可手动输入/pro将下一轮对话模型切换为v4 pro，完成该轮后Reasonix会自动切回便宜模型。
- 失败信号会触发自动升级：若失败次数达到预设警戒线，当前轮次的剩余部分将自动切换到v4 pro模型运行。

Reasonix的安装和使用相对简便，只需进入项目目录后执行npx reasonix code即可启动TUI会话。此外，该项目也提供了桌面版本。

值得注意的是，Reasonix官方强调该工具是专为DeepSeek打造的，其每一个抽象层级都基于DeepSeek的特性构建，因此它不具备通用性，也无计划发布通用功能。

关于Reasonix的讨论在社区中引起热烈反响。尽管其成本优化效果显著，但也有开发者提出质疑：“我们真的需要一个DeepSeek原生编程Agent吗？”有用户分享经验称，通过简单的API格式调整，将DeepSeek V4 Pro集成到Codex中，也能实现超过95%的缓存命中率。这表明，在某些场景下，非原生方案也能取得不错的成本效益。无论采取何种方案，成本节约无疑是开发者关注的焦点。

项目地址：https://github.com/esengine/DeepSeek-Reasonix

瞄准DeepSeek V4，Reasonix工具实现99.8%缓存命中率，大幅降低长会话成本

推荐阅读

软银股价创历史新高，OpenAI上市预期助推AI热潮

谷歌Gmail邮件引入表情符号：提升沟通效率与人情味

Anthropic员工用AI打造“关系Spotify Wrapped”婚礼网站，怒火表情包成亮点