2 月份一看账单 —— **$5000+**。
心态直接崩了。
仔细看了调用日志,发现 80% 的请求根本不需要 Opus 这种顶级模型:
- 龙虾问"今天天气怎么样" → Opus 处理,$75/百万 token
- 格式化一段 JSON → Opus 处理,$75/百万 token
- 翻译一句话 → Opus 处理,$75/百万 token
但 Gemini Flash 处理这些只要 $0.30/百万 token ,**差了 250 倍**。相当于每次去楼下买瓶水都叫劳斯莱斯。
所以花了两周写了个 LLM 智能路由 —— [ClawRouters]( https://www.clawrouters.com)
原理很简单:
1. 每个 API 请求进来,先用轻量模型分类(<10ms )
2. 根据任务类型自动选最便宜的能干活的模型
3. 兼容 OpenAI API 格式,改一下 base_url 就行
简单问答 → Gemini Flash ($0.30/M )
代码格式化 → Claude Haiku ($1.25/M )
翻译 → GPT-4o-mini ($0.60/M )
复杂推理 → Claude Opus ($75/M ,该花的还得花)
效果:**月账单从 $5000 降到 $800 以下**,输出质量没有明显变化。
现在终于可以安心养更多海外龙虾了 🦞
有个免费的 BYOK 方案 —— 自带 API Key ,路由零加价。不像 OpenRouter 每笔请求抽 5.5%。
支持 50+ 模型,自动 failover 。有同样被 token 费用折磨的 V 友吗?欢迎交流省钱经验。

