Token Saver — Claude Code 省钱工具箱
基于 Claude Code 源码分析和缓存架构,提供可立即执行的 token 优化策略。
核心原理
Claude Code 每轮对话将以下内容完整打包发送给 API:
- 系统指令(角色定义、行为准则)
- ~40 个工具的完整定义
- CLAUDE.md 项目上下文
- Git 状态快照
- 完整对话历史
- 本轮消息
第 N 条消息的实际输入 = 前 N-1 条全部内容 + 新消息(线性增长)
提示缓存机制(以 Sonnet 4.6 为例)
| 计费类型 | 价格 / 百万 token | 相对正常价 |
|---|---|---|
| 正常输入 | $3.00 | 100% |
| 缓存写入 | $3.75 | 125%(首轮建缓存) |
| 缓存读取 | $0.30 | 10%(后续命中) |
系统提示占每轮输入的 60-80%,缓存命中后只付一折。
缓存断点位置
Claude
[Description truncada. Veja o README completo no GitHub.]