1.2 KiB
1.2 KiB
created, type, tags, source
| created | type | tags | source | |||
|---|---|---|---|---|---|---|
| 2026-03-08 21:32 | zettel |
|
https://github.com/affaan-m/everything-claude-code |
Everything Claude Code Token 优化
节省 60%+ 成本的四个策略
1. 模型路由
90% 任务用 Sonnet,Haiku 做搜索/文档,Opus 只用于架构和安全。用 /model-route 自动路由。
2. MCP 精简
- 保持 < 10 个 MCP 启用
- 用 CLI + skill 替代 MCP wrapper(如 gh CLI 替代 GitHub MCP)
- 每个 MCP 消耗上下文窗口,多到一定程度 200k 变 70k
3. 工具替换
mgrep 替代 grep/ripgrep,在 50 任务 benchmark 中减少约 2x token 使用。
4. 代码模块化
文件保持 200-400 行(最大 800)。模块化代码库让 agent 不需要读取大文件,减少上下文消耗,且首次成功率更高。
配置
{
"model": "sonnet",
"env": {
"MAX_THINKING_TOKENS": "10000",
"CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50"
}
}
Skill 的渐进式加载
Skill 启动时只读描述(约 100 tokens),只在相关时才加载完整内容。这比把所有内容放在 CLAUDE.md 系统提示中高效得多。