48 lines
1.2 KiB
Markdown
48 lines
1.2 KiB
Markdown
---
|
||
created: "2026-03-08 21:32"
|
||
type: zettel
|
||
tags: [claude-code, token-optimization, cost]
|
||
source: "https://github.com/affaan-m/everything-claude-code"
|
||
---
|
||
|
||
# Everything Claude Code Token 优化
|
||
|
||
## 节省 60%+ 成本的四个策略
|
||
|
||
### 1. 模型路由
|
||
90% 任务用 Sonnet,Haiku 做搜索/文档,Opus 只用于架构和安全。用 `/model-route` 自动路由。
|
||
|
||
### 2. MCP 精简
|
||
- 保持 < 10 个 MCP 启用
|
||
- 用 CLI + skill 替代 MCP wrapper(如 gh CLI 替代 GitHub MCP)
|
||
- 每个 MCP 消耗上下文窗口,多到一定程度 200k 变 70k
|
||
|
||
### 3. 工具替换
|
||
mgrep 替代 grep/ripgrep,在 50 任务 benchmark 中减少约 2x token 使用。
|
||
|
||
### 4. 代码模块化
|
||
文件保持 200-400 行(最大 800)。模块化代码库让 agent 不需要读取大文件,减少上下文消耗,且首次成功率更高。
|
||
|
||
## 配置
|
||
|
||
```json
|
||
{
|
||
"model": "sonnet",
|
||
"env": {
|
||
"MAX_THINKING_TOKENS": "10000",
|
||
"CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50"
|
||
}
|
||
}
|
||
```
|
||
|
||
## Skill 的渐进式加载
|
||
|
||
Skill 启动时只读描述(约 100 tokens),只在相关时才加载完整内容。这比把所有内容放在 CLAUDE.md 系统提示中高效得多。
|
||
|
||
---
|
||
|
||
## Related
|
||
|
||
- [[Everything Claude Code 最佳实践]]
|
||
- [[Everything Claude Code Agent 编排模式]]
|