⚡ News

瞄准DeepSeek V4,Reasonix工具实现99.8%缓存命中率,大幅降低长会话成本

瞄准DeepSeek V4,Reasonix工具实现99.8%缓存命中率,大幅降低长会话成本

DeepSeek V4模型系列发布后,其官方已宣布永久降价。然而,开源社区并未止步于此,一个名为Reasonix的项目通过创新方案,将DeepSeek V4的长会话缓存命中率提升至惊人的99.82%,显著降低了使用成本。这意味着原本价值61美元(约414元人民币)的4亿+token账单,现在可直降至12美元(约81元人民币),成本降低了近80%。

Reasonix是一款专为DeepSeek打造的终端编程助手(coding harness),其核心目标是为DeepSeek用户节省成本。它能使长会话的缓存命中率维持在90%以上,将输入token成本降低至原来的五分之一。

Reasonix的实现思路基于字节稳定的前缀缓存(prefix-cache)和“只追加”(append-only)的运行循环设计。其工作流程专门适配DeepSeek的缓存机制:固定历史上下文,新消息只往后追加,从而确保每次请求的前半部分保持一致,极大提高缓存命中率,有效降低长会话的成本。

其架构可分为三个核心组成部分:

  • 缓存优先循环(Cache-First Loop): 自动前缀缓存仅在当前请求的精确字节前缀与先前请求匹配时激活。为解决多数Agent循环在每次交互时重排序、重写或注入新时间戳的问题,Reasonix将上下文划分为三个区域:
    • 前缀区: 固定内容,每个会话仅计算一次。
    • 历史消息区: 只追加,不重写。
    • 草稿区: 任何信息在归入日志前,都需通过“工具调用修复”进行提炼。
  • 工具调用修复(Tool-Call Repair): DeepSeek在使用中可能遇到工具调用JSON内部生成却在最终消息中消失、JSON参数畸形、同一工具反复调用参数相同(重复调用风暴)、以及JSON被截断等问题。Reasonix的工具调用修复机制会在真正执行前,通过四轮处理尝试修复这些问题。
  • 成本控制:
    • 默认优先使用更经济的v4 flash模型,仅在遇到困难任务时自动切换到v4 pro。
    • 每个轮次结束后自动压缩上下文。
    • 用户可手动输入/pro将下一轮对话模型切换为v4 pro,完成该轮后Reasonix会自动切回便宜模型。
    • 失败信号会触发自动升级:若失败次数达到预设警戒线,当前轮次的剩余部分将自动切换到v4 pro模型运行。

Reasonix的安装和使用相对简便,只需进入项目目录后执行npx reasonix code即可启动TUI会话。此外,该项目也提供了桌面版本。

值得注意的是,Reasonix官方强调该工具是专为DeepSeek打造的,其每一个抽象层级都基于DeepSeek的特性构建,因此它不具备通用性,也无计划发布通用功能。

关于Reasonix的讨论在社区中引起热烈反响。尽管其成本优化效果显著,但也有开发者提出质疑:“我们真的需要一个DeepSeek原生编程Agent吗?”有用户分享经验称,通过简单的API格式调整,将DeepSeek V4 Pro集成到Codex中,也能实现超过95%的缓存命中率。这表明,在某些场景下,非原生方案也能取得不错的成本效益。无论采取何种方案,成本节约无疑是开发者关注的焦点。

项目地址:https://github.com/esengine/DeepSeek-Reasonix

↗ 阅读原文