当然,不是昨天才觉得。
是每次看到额度快见底的时候,都会有一种熟悉的味道。
就像穷的时候看着钱包里最后的碎银几两。
总觉得还能再撑两天。
于是我开始思考一个问题。
有没有什么办法,可以让 Claude Code Token 消耗的慢一些?
作为一个从小穷过的人,我有个不太好的习惯。
就是当钱要花出去的时候,第一反应不是扫码,
而是看看能不能,晚一点再支付。
这时候,窗外的一抹夕阳,照射在我脸上,多么高光的时刻。
顶着不下班的幌子,启动了我那不太优秀,但爱钻研学习的大脑。
第一个想法:
用 Claude code ,主要用的还是 Opus 4.8 ,也是目前能用最贵的。
执行一个任务,它总要疯狂地看文件、修改文件
如果是只让 Opus 负责思考、总结、下达任务,而那些搬砖、码字、改文件的脏活、累活,都让本地模型跑,或者更便宜的模型跑,这样是不是会更好?
说干就干,名字叫 dsb 。
为啥?咱不是要省 token 吗?那绝对是能省则省,名字也要省,讲究的就是一个“短小精干”。
当然,兄弟们都是长长久久。
刚看资料的时候,那个兴奋呐。
感觉一个 100K star 的项目,已经在路上了,我甚至连 README 怎么写都想好了。
接下来,就是问 AI 可行性
GPT 说:思路是对的,干吧,很有前途的想法。
我把 GPT 的想法发给 Gemini ,表示高度认同,甚至当场帮我把提示词都写出来了。
贴出来,给兄弟们看看 →
完整 Prompt 已归档到项目文档 👉 docs/dsb.md
简单的过了一下,MCP 了解过,但没深入。
想到 AI 都这么确信了,那就直接开干。
建目录,写 AGENT.md, 一顿操作猛如虎,我还特意问了一下 GPT ,如果是 DeepSeek v4 Flash ,写这个项目是否可行?
答案:可行。
这里要给 DeepSeek 点个赞, 写的很快, 关键还便宜。
后面的故事,搞过的兄弟们都知道。
很快第一版就出来了,但是跑不通啊。
秉承着“既然有了 AI ,就尽量不写一行代码”的原则,我把 Bug 重新抛给 GPT 。改啊改啊,终于通了。
启动本地部署的 DeepSeek v4 Flash 。
这个要给 redis 之父也点个赞,如果有兴趣折腾本地模型的,可以去研究一下这个项目 https://github.com/antirez/ds4 。
改好 Claude Code 的配置
{
"mcpServers": {
"dsb": {
"command": "node",
"args": ["/aihop/dsb/dist/mcp-server.js"],
"env": {
"DSB_LLM_BASE_URL": "http://127.0.0.1:1234/v1",
"DSB_LLM_API_KEY": "ds-local",
"DSB_LLM_MODEL": "deepseek-v4"
}
}
}
}
重启 Claude Code 。
一顿跑,不是说能省 token 吗?
结果我本地模型的控制台上面,运行痕迹一动没动。
我用 Claude Code 把项目切换到 dsb 本身。
我满怀期待地问了 Claude Code 一个问题:
这玩意儿能省 Token 吗?
Claude Code 看了看自己刚刚写出来的项目。
回答:不能。
它甚至还建议我立即停止这个无意义的项目。
我的第一反应是:是不是你看到我要少烧你的 token ,故意的吧?!
我立刻把 Claude Code 的结果复制给 GPT 。
得,这时候两边的大模型就开始隔空较量了。你说我说的不对,我说你的理解有误。
大致的意思:
Opus 说:你这个省 token 的前提大半是假的,我原生的 Edit 工具是定位替换,token 消耗极少。而你搞的这个 delegate_edit 会把文件全部读一遍,消耗反而更大。
GPT 反驳说:Claude Code 你只看到了“当前编辑行为”,但 dsb 本质上是一个“AI 调用结构优化层”……
它们在我的屏幕上你来我往,吵得不可开交。
最终的结论:还是不能。
我看他们说的都有道理。
只是这些“没有道理的事”,好像 token 耗的都是我的。
好像还有我的青春。
看着屏幕上的时间,不知不觉,已经凌晨 3 点了。
哎呦,站起来揉揉老腰!
真不敢相信,1986 年出生的我,我算了算,2026-1986 ,不是应该等于 30 岁吗?
我心里一直这么认为的。
30 岁的小伙子,咋就会腰酸呢!
不过转念一想,咱们搞开发的,哪个不是这么一路折腾过来的呢?
要是缺了这点折腾,人生也会少很多乐趣。
至少昨天凌晨四点,我又学会了一些新东西。
顺便用几块钱的 Token 确认了一件事:
有些坑,必须自己亲脚跳进去,才知道它到底有多深。
一些其他的坑
[ol]
[/ol]
如果折腾本地模型,拿它来一个个处理单文件、写写函数、跑跑简单的单点测试,那是完全可以的。
但如果是用它来跑复杂的 Agent 、理解大工程、修改复杂的跨文件 Bug ,听哥们一句劝:别折腾了。
我用的是 MacBook M5 Pro 128G
后面我会专门开一篇,跟大伙详细聊聊这个跑本地模型的真实体验。
[ol]
折腾是技术人的本能,但真的不能太熬夜。
通宵死磕,总的来说并不能提升真正的时间效率。人一旦熬到凌晨两三点,极容易进入一种“钻牛角尖”的亢奋状态。以为在高效思考,实际上大脑已经过度活跃了,等想睡的时候根本睡不着。结果就是第二天整个人跟报废了一样,一点精神都没有。
用一天的报废去换深夜的自我感动,这笔资源调度怎么算都是亏本的。
[/ol]
钱没省下来,README 也删了。
但我知道,只要遇到下一个好玩的坑,我这颗爱钻研的大脑,肯定还是会毫不犹豫地跳进去。
有收益的
能抽些时间写写东西,一个是能复盘技术,但更重要的,是能借此整理自己内心的秩序。
其实写东西的习惯我一直都有。这么多年感受下来,这是让我受益最多的一件事。只是以前,我习惯把这些碎碎念写成一封封邮件发给自己。
直到最近,我决定开始写《底层重构》。
这本书的内容我同步托管在 GitHub 上连载:
👉 https://github.com/aihop/Refactoring-the-Self
我想,与其把这些留在自己的垃圾箱里,不如沿着这个思路继续写下去,毫无保留地分享给大家伙。
里面有二十年前走过的泥泞,有二十年后和 AI 斗智斗勇的折腾。有对的,也有交学费的。如果有说得不对的地方,希望大伙在评论区直接指正。
谢谢大家,咱长长久久。

