最后还是自己做了一个自己用,使用 macOS Accessibility API 操作现有的 Chrome 访问小红书网站来做交互。https://github.com/cadl/ax-xhs-cli 支持查看 feed 、搜索、查看用户页面,以及上面这些页面中查看翻页笔记内容等等常用的操作
跟一些其他方案的对比是:
[ol]
基于 macOS Accessibility API 来操作现有的 Chrome 浏览器。不使用 CDP ,不注入 js 代码,单纯像人一样识别浏览器中的内容然后操作
代码库中维护了一系列自然语言描述的核心功能测试用例,可以定期让 AI 工具跑一遍测试用例,验证现在是否可用。可以参考 readme 中 快速验证
部分的录屏视频。页面变更导致功能失效,方便发现和更新
[/ol]
另外 cli 中弄了一个 session 的概念,跟浏览器中的 tab 绑定,任务完成结束 session 后,自行关闭打开的浏览器 tab ,看着省心点,不会留下一堆 tab 在浏览器
因为是基于 Accessibility API 的,所以要给 Chrome 以及终端应用赋予 辅助功能 的权限(还有截屏功能权限,用于查看笔记有没有点赞收藏过)。使用时会跟自己抢浏览器和鼠标,还有锁屏后不可用的一些缺点,适合有一台空闲随时待命的电脑使用。另外是速度比较慢,只适合作为机械臂提升自己的能力,不适合不推荐账号让 ai 托管,慎用写操作

