我记得之前有一段时间,大部分的输入和缓存都是由 Haiku 这个模型去承载的,导致现在消耗得特别快。大家有遇到这个问题吗?是怎么解决的?
p.s 我默认/model 都是选择 Opus 的
————————
模型使用统计 (今日)
╭────────────────┬──────┬───────────┬───────────┬──────────┬──────────┬────────╮
│ 模型 │ 请求 │ 输入 Token │ 输出 Token │ 缓存创建 │ 缓存读取 │ 费用 │
├────────────────┼──────┼───────────┼───────────┼──────────┼──────────┼────────┤
│ claude-opus-4… │ 151 │ 2.8M │ 45.8K │ 1.6M │ 8.1M │ $29.34 │
│ claude-haiku-… │ 152 │ 41.5K │ 2.1K │ 25.7K │ 123.3K │ $0.10 │
╰────────────────┴──────┴───────────┴───────────┴──────────┴──────────┴────────╯

