问 Gemini ,它这么说的:
为什么“同一款模型”有两个价格?
虽然 gemini-flash-latest 目前指向的底层权重( Weights )可能与 gemini-3-flash-preview 完全一致,但它们在 Google 的计费系统中属于不同的 SKU (库存单位):
gemini-3-flash-preview (预览版定价):
它是为了给开发者测试最新功能(比如更高的并发、还没完全稳定的新模态支持)准备的。Google 通常会对“预览版”设置一个更高的价格墙,以筛选出真正的测试者,并覆盖实验性服务器的运行成本。
gemini-flash-latest (稳定版/全量版定价):
这个别名指向的是已经经过压力测试、准备好大规模商用的“稳定版本”。为了在市场上与 GPT-4o-mini 或 Claude Haiku 竞争,Google 会给这个别名设定一个极具竞争力的“市场价”。
本质区别: 你付的不仅仅是 Token 钱,还有服务级别( SLA )和定价策略的钱。latest 享受的是大规模推广期的优惠补贴。

