工作场景中,有几个问题让我很头疼:
用 OpenClaw 让模型直接驱动浏览器
[ol]
[/ol]
于是做了一个 RPA (自动化机器人程序) 技能来根本性地解决这两个问题——
🔴 核心思路
录制一次真实操作 → 自动生成 Playwright Python 脚本 → 以后直接跑脚本。
不再调大模型,没有幻觉,每次执行路径完全一致,结果可预期。
✅ 主要功能
• 在真实 Chrome 里逐步录制,选择器直接从 DOM 读取,不靠模型猜
• 支持多步任务自动拆解,防止单次请求超时
• 生成可独立运行的 .py 文件,脱离 OpenClaw 也能跑
• 支持浏览器操作 + 本机文件提取(存到桌面等)
• 在 OpenClaw + 飞书/IM 里可以发 #rpa-run:任务名 随时触发或定时执行
📌 典型场景
电商登录下单、Yahoo 财经行情抓取、豆瓣影评提取、新闻标题汇总……
录一次,之后随时回放,每次结果稳定一致。
📖 详细介绍和安装说明:
https://github.com/laziobird/openclaw-rpa/blob/main/README.zh-CN.md
里面有案例视频演示
Skill 地址 https://clawhub.ai/laziobird/openclaw-rpa
推荐使用大模型:Minimax 2.7 、>= Gemini Pro 3.0 、Claude Sonnet 4.6
如果有人也在研究怎么让 Agent 跑得更稳、成本更低,欢迎一起交流!

