News

五招教你节省 30% Claude Code 账单:实战 Token 优化指南

五招教你节省 30% Claude Code 账单:实战 Token 优化指南

在过去几个月里,我每天都在使用 Claude Code。虽然输出质量惊人,但月底的 API 账单也确实令人肉痛。经过一系列实验,我总结了 5 个在不牺牲代码质量的前提下,能稳定减少 25-35% Token 消耗的习惯。

1. 在项目根目录放置 CLAUDE.md

Claude Code 在启动时会自动读取 CLAUDE.md 并将其视为持久上下文。如果没有它,Claude 每次会话都必须重新探索项目结构,这会消耗大量读取 Token。建议使用包含项目栈、布局和规范的精简模板,并保持在 200 行以内,避免 Claude 浪费 Token 去总结该文件本身。

2. 充分利用提示词缓存(Prompt Caching)

Anthropic 提供提示词缓存功能:如果输入与之前的请求匹配,读取成本仅为正常价格的 10% 左右。这意味着在 200K Token 的项目上下文中,如果缓存命中率达到 70%,单次会话的输入成本可以从 0.60 美元降至 0.18 美元。

3. 养成良好的缓存习惯

为了最大化缓存收益,请注意:不要在会话中途修改 CLAUDE.md,否则会导致缓存失效;在追加问题时,尽量采用“增量”方式而非重写 Prompt;对于长文件,粘贴一次后后续只需引用“上述文件”即可,不要反复粘贴。

4. 优先使用 Read 工具而非手动粘贴

向 Claude 提供文件有两种方式:手动粘贴全量内容,或使用 `Read src/foo.go` 指令。后者更便宜,因为 Claude 只有在真正需要时才会读取文件,且通常只读取相关的代码片段,而手动粘贴则无论是否需要,你都必须为全量 Token 买单。

5. 针对常规任务切换小型模型

你并不总是需要 Opus 来编写单元测试或简单的增量修改。对于脚手架生成、添加日志、变量重命名或简单测试用例等机械化任务,切换到 Sonnet 甚至 Haiku 能带来 5 到 15 倍的成本节省。建议将 Opus 留给架构决策、复杂 Bug 调查等深度推理任务。

避坑指南

我也尝试了一些无效的方法:手动压缩提示词(太费精力且容易丢失上下文)以及使用廉价的第三方“Opus”中转(往往是国产开源模型伪装的,质量大幅下降)。

↗ 阅读原文