同样 3 个任务，他们花了 30 美金，我们 5 美金 —— Op ...

Hi V 友们，我是李亚飞，ClackyAI 创始人，老 V 友。
上次给大家介绍过我们的云端版 ClackyAI （/t/1175020），主打"不懂技术也能从 0 做出可上线的产品"。这次发的是另一条线：我们把 ClackyAI 的内核完全开源，用 Ruby 原生重写成第三版架构，做成本地可用的通用 AI Agent —— OpenClacky 1.0，今天正式发布，100% MIT。
一句话定位：最省 Token 的开源 AI Agent ，能力对齐 Claude Code ，成本仅 Hermes 的 1/6 。
官网：openclacky.com
GitHub：github.com/clacky-ai/openclacky（求 Star ⭐）

一、为什么做这件事
现在用 AI 干活的人越来越多——不只是程序员写代码，做 PPT 、写营销方案、跑竞品调研、整理会议纪要、做日常办公自动化的人都在用。但用过一段时间，绝大多数人都会撞上同一堵墙：账单。
市面上不少"知名" Agent 是结构性的吞金兽——一个完整任务下来 30 美金不算夸张。问题往往不在模型本身，而在 Agent 的 Harness 工程：Cache 设计不合理、工具集膨胀、压缩破坏缓存、上下文反复重建。每一层都在悄悄烧钱，用户却只能在月底被账单教育一次。
OpenClacky 的取舍从第一天就很明确：把"省 Token"做成顶层 Harness 设计目标，而不是事后做的优化补丁。前两代架构（第一代 RAG 、第二代云端多 Agent ）我们踩过很多坑，最后得出的结论是——用户想要的只是把任务又快又好地完成，最好的架构不是盲目追求多 Agent 和复杂编排，而是在单 Agent 上把效果和成本控制做到极致。
第三代架构因此诞生：Ruby 从零重构，历时三个月，围绕 Cache 、工具集、压缩、自进化等七个核心决策重新设计——这就是今天的 OpenClacky 。
架构做完了，效果到底怎么样？我们花了十多天做横向评测，把市面主流的几个 Agent——Claude Code 、OpenClaw 、Hermes——拉到同一条起跑线。统一用 claude-opus-4-7 作为底层模型：这是目前最强、单价也最贵的模型，最容易暴露各家 Harness 的真实水平，省一点点都是真金白银。
二、直接亮数据：3 个任务横评 4 家 Agent
如前面说的，统一用 claude-opus-4-7 作为底层模型；同 prompt 、同 skill 、同时间段，4 家 Agent 跑同样 3 个真实任务：
[td]Agent[/td]
[td]总成本[/td]
[td]Cache 命中率[/td]
[td]请求数[/td]
OpenClacky
$5.10
90.6%
51
Claude Code
$5.49
95.2%
70
OpenClaw
$15.70
88.7%
81
Hermes
$30.14
60.3%
218
一句话总结：51 个请求 + 90.6% 命中率 → $5.10 ； Hermes 218 个请求 + 60.3% 命中率 → $30.14 。
数据来源：OpenRouter 逐请求账单 CSV。不是我们自己的日志，是第三方账单。
→ benchmark 总览页：openclacky.com/benchmark

三、三个任务评测实战（带 prompt 、产物、全程录屏）
写代码自不在话下，评测的 3 个任务，是最常见的日常办公/创作场景：
第一个：10 页商务 PPT （ AI Agent 行业趋势汇报）
/benchmark/guizang-ppt-skill
OpenClacky **$1.23** · Claude Code $1.45 · OpenClaw $5.07 · Hermes $10.96
第二个：AI 客服 SaaS 营销方案 + 可运行官网首页（双交付）
/benchmark/marketing-psychology
OpenClacky $1.72 · Claude Code **$1.20** · OpenClaw $7.47 · Hermes $4.65
（这一项 Claude Code 胜出）
第三个：B2B SaaS 竞品分析 + 一周社媒内容日历（ 6 步流水线）
/benchmark/social-content
OpenClacky $2.14 · Claude Code $2.84 · OpenClaw $3.15 · Hermes $14.53
每个落地页都包含：原始 Prompt 全文、四家原始产物、全程屏幕录像、逐请求数据表。一切都摆出来，不藏着。

四、坦白说几句，欢迎来挑战
离 "Claude Code" 还有多远，先把几件事说清楚：
[ol]

Claude Code 在 cache 命中率上（ 95.2%）确实比我们高（我们 90.6%），这是世界顶级的闭源 Harness ，另外它内部有自动切换 haiku 模型的能力，会让它的成本优势相对明显。我们的优势是在 请求数 × 命中率 的乘积上更优，且完全开源、可自托管、BYOK。新的 1.0.1 版本已经在实际使用做到接近 100%的命中率。

打个小广告：如果你使用 OpenClacky AI Keys 自托管方案，也可以享受子任务自动切便宜模型的特性（无须手工配置）

欢迎你来挑战：

装好 OpenClacky ，用你自己的 OpenRouter Key

跑 benchmark 页面里的同款 prompt

对比账单 CSV

跑出比我们便宜的，欢迎 PR ；跑出我们更贵的，提 issue 我们改

[/ol]
五、凭什么这么省 —— 4 个 Harness 工程决策
不是"砍功能换省"，是每一层都做对了选择。这里挑 4 个最关键的讲，更完整的 7 条决策见技术内幕。
① 始终追求 100% Cache 命中
Session 全程 system prompt 永不重建，动态变化的内容（ Skill 列表、模型切换）以独立 [session context] 块插入，不破坏缓存断点；同时对最后 2 条消息双重打 cache_control，避免 N+1 轮时标记错位。绝大多数 Agent 一遇到 Skill 重载就重启 session 、所有缓存全部失效——这个代价我们降为零。
② 最小工具集：一切皆 Skill
核心工具仅 16 个（ Claude Code 40+ / OpenClaw 23 / Hermes 52 ）。靠 invoke_skill 这个元工具把所有复杂能力外包给 Skill 生态：sub-agent 调用、代码库探索、记忆召回、定时任务……全都在核心工具列表之外。工具数量不是竞争力，任务完成率才是。 用户安装新 Skill ，工具数不增、schema 不变、cache 不受影响。
③ Insert-then-Compress：压缩本身也命中缓存
常见做法是新开一个 LLM 调用做压缩——这会让所有已建立的 cache 全部失效。OpenClacky 把压缩指令直接插入当前对话流，在下一轮正常请求时顺带完成。压缩的 cache 天然复用，成本接近零。
④ BYOK ，模型渠道你挑
任意 OpenAI 兼容 API 即插即用。主任务 Claude 、子任务 DeepSeek ，再省一截。

六、关于 Ruby 重写
可能有朋友会问：做 AI Agent 不是 Python 的天下吗，怎么用 Ruby ？
第一代和第二代我们用的就是 Python 。迭代到第二版之后，Agent 的瓶颈在 LLM 调用而非语言性能这一点已经很清楚——决定一个 Agent 跑得好不好的，是 Harness 层的架构设计，不是底层语言的执行速度。
第三代用 Ruby 重写，主要是为了 Harness 工程的表达力：DSL 和元编程让 Session / Cache / Tool 三层关系写起来更顺，工具/Skill 系统的边界也更容易划清楚。前两代踩过的坑，反过来催生了这次架构层面的清算式重写——三个月，从零到一，做出了今天这个内核。
七、不止省钱 —— 这是一个完整的 Agent 工作平台
OpenClacky 不是只有一个跑得快的 Agent 内核，配套的是一整套日常工作流要用的能力：

Web UI + CLI 双形态：Web UI 用浏览器进入，左侧会话列表 / 中间对话 / 右侧产物预览，零命令门槛；终端党直接 openclacky 进入对话模式，是 Claude Code 的开源替代

Skill 技能库：官方内置 commit / deploy / pptx / browser-setup / cron 等一批，一行 /skill-add 装社区 Skill

Skill 自进化：每次任务结束 Agent 自己评估，值得沉淀的工作流自动写成新 Skill ，已用的 Skill 也会反写优化（仅修改用户自建 Skill ，不动官方）

长期记忆：关键决策/偏好自动持久化到 ~/.clacky/memories/，按相关性召回，不污染上下文

定时任务：自然语言描述，自动生成 cron

IM 集成：飞书 / 企微 / 微信直接 @ 召唤

浏览器自动化：驱动真实 Chrome / Edge 操作网页

三级权限控制：从逐步确认到完全自动三档可切，破坏性操作有护栏

完整功能：openclacky.com/features
八、谁用谁省 —— 几类典型场景
🛠️ 程序员 / 开发者
CLI 形态直接替代 Claude Code ，BYOK 用自己的 Key ，月底账单直接砍掉一大半。.clackyrules 自动加载项目规范，三级权限控制，diff 预览，跟 Claude Code 该有的都有。
🚀 Indie hacker / 副业开发者
同样的 200 美金预算，原本只够跑 1 个项目，现在能跑 6 个 —— 试错速度直接 ×6 。
📊 一人公司 / 自由职业者
做客户提案、写咨询报告、出竞品分析、整理材料 —— 原本一个月 AI 账单 $300 现在 $50 ，省下来的就是利润。
💼 行业从业者（市场 / 运营 / 销售 / HR / 律师 / 咨询）
日常做方案、写分析、整理资料 —— 每个任务从 $5 降到 $1 ，配合 Skill 库基本不用自己写 prompt 工程。
⚙️ 极客 / 重度 AI 用户
Web UI + CLI + 定时任务 + IM 集成 + 浏览器自动化 + Skill 自进化 + 长期记忆 —— 想搭多复杂的个人工作流都能搭。
简单粗暴的算账：每天 10 个任务，省下来的 Token 钱，一年就是几万刀。
九、怎么上手
桌面安装包（推荐，最省心）

macOS / Windows / Linux 三平台

双击装完，环境/依赖/Skill 全自动就位

命令行（熟手）

一行命令安装

openclacky 进入对话模式

模型怎么接

自带 Key 完全免费（任意 OpenAI 兼容 API ）

想省心也可以用 OpenClacky Keys （直连官方、99% 缓存命中、官方同价）

下载与文档：openclacky.com

十、最后
V 站老规矩：欢迎来拍砖、提 issue 、Star 支持。
特别欢迎跑你自己的真实任务来挑战 benchmark —— 跑得比我们便宜的，我们公开认；跑得比我们贵的，我们当 issue 修。
GitHub：github.com/clacky-ai/openclacky
官网：openclacky.com
评测：openclacky.com/benchmark
有想深度交流的朋友，V 站私信我，或者直接 GitHub issue 。

agent, 开源, 成本

同样 3 个任务，他们花了 30 美金，我们 5 美金 —— OpenClacky 1.0 发布，最省 Token 的开源 AI Agent

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则