[开源] 带领 AI 团队开发了一个极轻量的 GT AI Gateway：支持协议转换、请求查看，还能大幅降低 Claude Code 等调用成本

查看 173|回复 13

zh3256 2026-6-21 21:46:35

缓存率到 97 ％为何成本能降低 10 倍以上？
我理解即使 100 ％缓存，也只是 prompt token 一折，算上 completion token 也没十倍。

iomect 2026-6-21 21:47:06

你说的这些 AxonHub 好像都能实现啊我公司分发一直用的 CPA+AxonHub

AlexaZhou

2026-6-21 21:47:40

@iomect
感谢指出，不过功能还是差很多的，比如这几个功能，应该是属于 GtAIGateway 有而 AxonHub 没有：
1. 可以用可视化对话的方式来查看请求
2. 部署到免费的 serverless 平台上，如 cloudflare worker
2. 开箱可用的提升缓存命中改写功能（ AxonHub 或许能手动写规则通过改写来实现，但手动也很麻烦）

AlexaZhou

2026-6-21 21:48:25

@iomect
感谢指出，这个要看不同的模型，如果 gpt-5.5 来说，prompt token 确实是打一折。那么算下来应该是 9 点几倍；
对 deepseek 模型来说，缓存价格是普通输入的 1%，那么就超过 10 倍了；
所以之类用了 10 这样一个概数来表达大概的程度

[开源] 带领 AI 团队开发了一个极轻量的 GT AI Gateway：支持协议转换、请求查看，还能大幅降低 Claude Code 等调用成本

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

[开源] 带领 AI 团队开发了一个极轻量的 GT AI Gateway：支持协议转换、请求查看，还能大幅降低 Claude Code 等调用成本

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告