五招教你节省 30% Claude Code 账单：实战 Token 优化指南

在过去几个月里，我每天都在使用 Claude Code。虽然输出质量惊人，但月底的 API 账单也确实令人肉痛。经过一系列实验，我总结了 5 个在不牺牲代码质量的前提下，能稳定减少 25-35% Token 消耗的习惯。

Claude Code 在启动时会自动读取 CLAUDE.md 并将其视为持久上下文。如果没有它，Claude 每次会话都必须重新探索项目结构，这会消耗大量读取 Token。建议使用包含项目栈、布局和规范的精简模板，并保持在 200 行以内，避免 Claude 浪费 Token 去总结该文件本身。

Anthropic 提供提示词缓存功能：如果输入与之前的请求匹配，读取成本仅为正常价格的 10% 左右。这意味着在 200K Token 的项目上下文中，如果缓存命中率达到 70%，单次会话的输入成本可以从 0.60 美元降至 0.18 美元。

为了最大化缓存收益，请注意：不要在会话中途修改 CLAUDE.md，否则会导致缓存失效；在追加问题时，尽量采用“增量”方式而非重写 Prompt；对于长文件，粘贴一次后后续只需引用“上述文件”即可，不要反复粘贴。

向 Claude 提供文件有两种方式：手动粘贴全量内容，或使用 `Read src/foo.go` 指令。后者更便宜，因为 Claude 只有在真正需要时才会读取文件，且通常只读取相关的代码片段，而手动粘贴则无论是否需要，你都必须为全量 Token 买单。

你并不总是需要 Opus 来编写单元测试或简单的增量修改。对于脚手架生成、添加日志、变量重命名或简单测试用例等机械化任务，切换到 Sonnet 甚至 Haiku 能带来 5 到 15 倍的成本节省。建议将 Opus 留给架构决策、复杂 Bug 调查等深度推理任务。

我也尝试了一些无效的方法：手动压缩提示词（太费精力且容易丢失上下文）以及使用廉价的第三方“Opus”中转（往往是国产开源模型伪装的，质量大幅下降）。

推荐阅读