Token 优化指南

Claude Code 使用可能很昂贵。以下设置可以在不影响质量的前提下显著降低成本。

设置说明

设置	默认值	推荐值	影响
`model`	opus	sonnet	约 60% 成本降低；可处理 80%+ 的编码任务
`MAX_THINKING_TOKENS`	31,999	10,000	每次请求隐藏思考成本降低约 70%
`CLAUDE_AUTOCOMPACT_PCT_OVERRIDE`	95	50	更早压缩——长会话中保持更高质量
`CLAUDE_CODE_SUBAGENT_MODEL`	默认	haiku	子代理使用更便宜的模型

仅在以下场景切换到 Opus：

/model opus    # 切换到 Opus 处理复杂任务
/model sonnet  # 完成后切回 Sonnet

ECC 包含的 strategic-compact 技能会在逻辑断点建议 /compact，而非等到 95% 上下文自动压缩。

关键

不要同时启用所有 MCP 服务器。每个 MCP 工具描述消耗 200k 窗口中的 Token，可能将其减少到约 70k。

最佳实践：

json

// 在项目的 .claude/settings.json
{
  "disabledMcpServers": ["supabase", "railway", "vercel"]
}

Agent Teams 会产生多个上下文窗口，每个队友独立消耗 Token。仅在并行性提供明确价值的任务中使用（多模块工作、并行审查）。对于简单的顺序任务，子代理更省 Token。