问一个 Agent 达到 limit 后的操作问题

查看 54|回复 6
作者:logoutC   
比如临睡前达到 limit 后,是
1 )开着终端,等到明天早上继续
2 )关掉终端,明天/resume
3 )关掉终端,明天不 resume 继续
服务器端的缓存过了 8 小时还存在吗?
另外,如果达到 limit ,把网络断了一段时间,服务器端检测不到 client 还活着,会主动把缓存清掉吗?

Limit, 缓存, 操作

AlexXXXX   
你说的如果是命中缓存,最多按小时算,短的 5 分钟就清空了。在想啥呢,那是实时加载到运算运存里的,不清空那不炸了吗。不是真电脑上的缓存。
iv8d   
等,wait ,sleep
Krman   
1.目前好像只有 deepseek 的 kv cache 是存储在硬盘上的,ds 的 kv 缓存 ttl 数小时至几天,在有效的 ttl 内,ds 是按照账户 id 来缓存的。至于开几个 session ,什么时候开 session 对 kv cache 是没有影响的。ttl 过期或者服务器强制清除缓存后,会重新开始计算 kv ;
2.claude 和 gpt 的 kv cache ttl 默认只有 5 分钟,最多可延长到 1h ( token 消耗会增加);
3.kv cache 复用是在 perfill 阶段,切记在 cc 或者其他 coding ide 上的同一 session 中不要随意切换模型( subagent 可以调用任意 llm ,独立的 context ,不会污染主 session 中的 context ,所以也不会破坏 prompt cache ),这样会导致 kv cache 复用失败(原因是不同模型在 perfill 阶段对 qkv 计算维度都不一样);
Krman   
claude 和 gpt 的 kv cache 主要存储在显存和内存上,所以 ttl 较短,不像 ds 存储在硬盘上可以保存那么久。
TTL:缓存有效期。
xiaxichen   
@Krman 阿里好像也加这种缓存策略了
mgcnrx11   
https://developers.openai.com/api/docs/guides/prompt-caching GPT-5.5 + 不是 24 小时吗? Extended prompt cache retention keeps cached prefixes active for longer, up to a maximum of 24 hours. Extended Prompt Caching works by offloading the key/value tensors to GPU-local storage when memory is full, significantly increasing the storage capacity available for caching.
您需要登录后才可以回帖 登录 | 立即注册

返回顶部