--- created: "2026-03-08 21:32" type: zettel tags: [claude-code, token-optimization, cost] source: "https://github.com/affaan-m/everything-claude-code" --- # Everything Claude Code Token 优化 ## 节省 60%+ 成本的四个策略 ### 1. 模型路由 90% 任务用 Sonnet,Haiku 做搜索/文档,Opus 只用于架构和安全。用 `/model-route` 自动路由。 ### 2. MCP 精简 - 保持 < 10 个 MCP 启用 - 用 CLI + skill 替代 MCP wrapper(如 gh CLI 替代 GitHub MCP) - 每个 MCP 消耗上下文窗口,多到一定程度 200k 变 70k ### 3. 工具替换 mgrep 替代 grep/ripgrep,在 50 任务 benchmark 中减少约 2x token 使用。 ### 4. 代码模块化 文件保持 200-400 行(最大 800)。模块化代码库让 agent 不需要读取大文件,减少上下文消耗,且首次成功率更高。 ## 配置 ```json { "model": "sonnet", "env": { "MAX_THINKING_TOKENS": "10000", "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50" } } ``` ## Skill 的渐进式加载 Skill 启动时只读描述(约 100 tokens),只在相关时才加载完整内容。这比把所有内容放在 CLAUDE.md 系统提示中高效得多。 --- ## Related - [[Everything Claude Code 最佳实践]] - [[Everything Claude Code Agent 编排模式]]