Gemini 3 Flash 用着挺香，但想找个更便宜的替代 ...

作者：wsbqdyhm 发布时间：2026-3-12 15:13:09

最近在折腾 OpenClaw （小龙虾）+ n8n 工作流做一些自动化任务，现在主要是薅 Google 的 $300 API credit 。
主力模型用的是 Gemini 3 Flash ，整体体验挺好，速度快、工具调用也稳，基本能顶住日常 workflow 。不过 Gemini 3.1 Pro 有调用限额，所以很多任务还是得靠 Flash 。
现在的问题是：
想找一个性能大致对标 Gemini 3 Flash ，但更有性价比的模型做备用 / 分流。
另外我本地也有一张 4090 ，所以也在考虑顺便搞个本地模型做 fallback ，简单任务或者离线的时候用。
在各大主流 ai 问了一圈，投票如下：
云端模型（对标 Gemini 3 Flash ）
Kimi K2.5-K2 （ 4 票）
DeepSeek R1 / V3.2 （ 1 票）
本地部署（ 4090 ）
DeepSeek-R1-Distill-Qwen-32B （ 4bit ）（ 3 票）
GLM-4.7-Flash （ 30B A3B MoE ）（ 2 票）
目前的思路大概是：
主力：Gemini 3 Flash
云端备用：Kimi / DeepSeek
本地：跑一个 30B 左右模型兜底
不过我自己还没实际长期跑过这些组合，所以想听听大家的真实使用经验：
Kimi K2.5 和 DeepSeek V3 / R1 实际体验怎么样？
有没有性价比能接近 Gemini 3 Flash 的模型？
4090 本地模型现在比较稳的是不是还是 32B 这一档？
欢迎拍砖，主要想听听长期在用的经验。

superkkk 2026-3-12 15:14:07

千问 3.5 35B A3B 或者千问 coder next ，这俩还行，但是毕竟免费开源的，24g 显存可能不够

liu731 2026-3-12 15:15:02

比它聪明的没它快，比它快的没它聪明

wsbqdyhm

OP

2026-3-12 15:16:02

@liu731 2.5flash 体验怎么样？之前用了一下 2.5 pro 弱智一样。

skyemin 2026-3-12 15:16:46

$300 API 现在还送吗

liu731 2026-3-12 15:17:21

@wsbqdyhm 简单任务（<=5K Token ）还不错。复杂任务不行

Gemini 3 Flash 用着挺香，但想找个更便宜的替代

热门主题

51吃完饭就吹牛逼，怀念过往全自动赚钱的日

包邮价： hahaSIM 只需要65！！！神卡 haha

五一放假没有地方玩

出PT站点永v

溢价700收个搬瓦工MEGABOX PRO 原邮

mjj人手一个的pt站PTT开放注册了！

【收】Netcup RS 1000 G11 iv SE NUE FEB25

又一个平台倒闭！360doc个人图书馆网站停止

劳工节快乐

把图片压缩到极致

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则