Yoo趣儿 › 探索分享 › 奇思妙想 › 用视觉和 AI 把 Vimium 功能弄到全屏幕任意按钮 ...

用视觉和 AI 把 Vimium 功能弄到全屏幕任意按钮

查看 206|回复 1

作者：garywill 发布时间：2023-5-22 08:45:27

不管你用过 vim 没，vimium 应该体验过
搞的一个实验性玩意，目前只需要 300 行 python 代码，能粗浅地识别屏幕上任意位置的“物件”，并用键盘去点击它们

现在就只是简单地用了 opencv 的 MSER 算法
使用视觉的优势有：
[ol]

跨平台

无论 GUI 库

无论 Accesebility API 是否可用
[/ol]
也已经有其他的能够在 Mac/Windows 上通过某些 API 找到按钮的项目（在 readme 里列出了）
虽然这种类型的软件里，好像只有浏览器上的 Vimium 成功了。其他的者还算在实验状态
若能把 AI 、API 、视觉三者结合，可能会比较好用。目前的演示看起来界面有点杂乱，想像改进后应该会好吧
各位有什么 idea 来 share 一下

vimium, API, 视觉, 按钮

公告

返回顶部

用视觉和 AI 把 Vimium 功能弄到全屏幕任意按钮

相关帖子

浏览过的版块

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

用视觉和 AI 把 Vimium 功能弄到全屏幕任意按钮

相关帖子

浏览过的版块

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告