glm5.1 Q8 模型大小 811G ,10 个人并发的 1M context kvcache ,算 Q4 压缩,一个人大概留 100G ,因为 agent 回反复读 context ,那么 10 个人就得 1T 。所以你要准备 2T 左右 gmem 的环境,目前能买到的 H20 单卡 96G ,起码准备 20 张,单机 8 卡,准备 3 台机器。 h20 96G. ebay 上目前大概 8w 一张,卡就要 160w ,算 40w 能搞到 3 台服务器,外加网络。200w 起步,还要自己搞环境,另外电费另算。
给你个市场的参考.. 我今天代购了 5 个 Premium, 正儿八经国内公司公对公, 开票和签合同一套下来, 6500/月; 这个是原汁原味的 claude team 账号 换言之 10 个人就是 1 万 3 50 万永久其实可以, 但是明智的老板, 会选择月付, 因为 AI 发展日新月异.. 与其有优惠半价绑死 1 年, 还不如短租保持灵活,随时能跳槽