[分享] ClaudeChrome - 在浏览器中启动 Claude/Codex,实现通用智能交互体验

查看 10|回复 0
作者:InkXPath   
ClaudeChrome 介绍

最近在做一个自己工作流需要的工具,随便起了个名叫 ClaudeChrome (也是蹭蹭热度哈哈)。图标也是暴力结合了几家 logo 的主要设计元素,反正权当项目 logo 先用着了。
众所周知 Anthropic 其实已经实现了一个官方的 Claude for Chrome 插件,但是并没有开源,而且之前也只能给 MAX 订阅用户使用(最近因为 CC 的开源风波,听说政策上有调整),所以就打算自己做一个。而且现在很多时候也会用 Codex ,所以不如先 build 这样的一个基础实现,后面做定制化,以及支持更多浏览器或者 Agent CLI 都很方便。
项目 idea 很简单:把 Claude / Codex / Shell 放进 Chrome 侧边栏( Shell 其实现在还没啥用,因为主要靠自行实现的 MCP Server 实现自动页面交互,主要是给未来一些插件脚本手动调用浏览器接口留空),并把每个 session 绑定到一个真实标签页(使用过程中也可以 rebind 标签页)。这样 Agent 看到的就不再只是你手动贴过去的一点信息,而是当前标签页的页面文本、HTML 、请求、console 等浏览器上下文。
项目特性如下:
  • 在 Chrome side panel 中直接运行 Claude / Codex / Shell
  • 每个 pane 绑定一个真实标签页,支持切换和 rebind
  • 读取页面内容、HTML 、网络请求、控制台、执行 JS 代码、运行 click, scroll 等交互
  • 多 workspace / 多 pane 组织视图

    还有一个比较重要的点,各个 Agent 都是绑定到本地环境的,所以可以直接让它保存页面信息到本地,或者结合本地的上下文做操作,Agent 的 session 和交互记录之类也都是和正常启动一样保存到本地的。除了 LLM 的 API 调用和浏览器访问,整个链路都是完全在本地运行的,所以比较安全。
    如下是一些我录制的应用场景演示,基本上都是一遍过。演示用的是 CC+Opus4.6 ,Codex 也是能跑的。现在 backbone 模型能力真的很强。
    2048 游戏操作:这个演示聚焦 ClaudeChrome 在 2048 游戏环境中的持续交互能力:它不会停在一次性读取,而是能围绕视觉元素持续进行长链路操作。

    Amazon 商品详情收集:这个演示主要展示 ClaudeChrome 的网页爬取能力,包括处理页面跳转和滚动交互的能力,同时会话始终保持绑定在当前浏览器标签页上。

    V2EX 论坛话题总结:这个演示展示了 ClaudeChrome 在 V2EX 页面中爬取论坛内容,并根据用户要求执行 JavaScript 命令的能力。

    OpenClaw 展示页风格拟合:这个演示突出 ClaudeChrome 的浏览器扩展能力:它可以模仿现有网站来原生设计相似风格,比传统的手动拷贝样式表更方便,也更准确。

    知识摄取与文本选中:这个演示聚焦于与之前 Tapestry 项目的集成:不调用 Tapestry 自带爬虫,也能把页面内容直接写入知识库,同时展示基于页面选中文本触发动作的能力。

    更清晰的录制请见项目主页和仓库:
    项目主页:
    https://natsufox.github.io/ClaudeChrome/index-zh.html
    仓库:
    https://github.com/NatsuFox/ClaudeChrome
    README:
    https://github.com/NatsuFox/ClaudeChrome/blob/main/README.md
    目前我在功能和实现上做了比较多的工作,在跨平台上还没有做太多测试,暂时只在 Chrome ,以及 MacOS 和 Linux (指在本地启动的 MCP Server ) 上跑过,不过常理上说应该都支持的。
    下一步打算优化下 Agent 对 MCP tools 调用的体验,现在如果不显式说 “标签页” 等表达,Agent 经常不会主动意识到是要在浏览器内操作,在上面的 demo 中也能看到这样的问题。后面我加一些 System Prompt 的预设,告诉 Agent 目前它已经进入了浏览器的领域内。
    最后,大家如果因为平台不支持,或者跑起来以后有任何大大小小的问题,随便+强烈欢迎提 issue 和 PR ,没有格式之类的要求,只要和项目相关,纯灌水也行。大家能真正用起来,就是项目最大的价值,我会一直维护下去。如果有实际帮助,欢迎大家点点 Star 🌟,这对我来说非常重要 :)
    Tapestry 更新发布

    顺便也宣传一下之前的 Tapestry 。最近 Karpathy 也发表了关于 LLM Wiki 的讨论,其实最初 Tapestry 的定位几乎就是一个简便的 Agent powered 个人知识库,但看起来并没有产生太大的 impact :)
    似乎插入外部链接有些限制,加了个 emoji
    卡帕西解锁大模型新玩法!构建个人知识库,“大部分 Token 已经不跑代码了
    https://mp.w🤔eixin.qq.com/s/UjaVCyw3lxp4e9zn5b8KQA
    显然 ClaudeChrome 可以和 Tapestry 有机结合,将当前在浏览器看的内容直接整合到本地知识库,绕开了对于内置爬虫的需要。我觉得这是一个很不错的组合(自己用着很爽哈哈)。
    在首次发布后的一段时间里,已经在细节上做了不少优化,知识库前端效果和实际使用体验上都有了比较大的提升,也专门做了项目主页。后续打算仔细研究一下 Karpathy 提出的架构和范式,将一些有用的 idea 落实到 Tapestry 中。
    相关的项目特性更新,基本情况等都写在主页里了,也附上先前在 V2EX 的发帖链接,欢迎大家再来关照一下:
    V2EX 帖子链接:
    https://www./t/1198796
    项目主页:
    https://natsufox.github.io/Tapestry
    仓库:
    https://github.com/NatsuFox/Tapestry
    README:
    https://github.com/NatsuFox/Tapestry/blob/main/README.md
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部