Use when a task requires interacting with a website beyond just reading it — clicking elements, filling forms, submitting data, navigating through multi-step flows, taking screenshots, or any workflow where the user needs a real browser with actions like click, type, scroll, or select. Also use for managing browser bookmarks, history, or tabs. Trigger whenever the user mentions browseros, browseros-cli, or BrowserOS. Do NOT use when simply fetching or reading page content would suffice — use cur
通过browseros-cli控制真实的Chromium浏览器。使用Bash运行命令。使用--json获取结构化输出,使用-p
bash
每次交互都遵循此循环:
关键规则:
bash
browseros-cli open https://example.com/login # → 页面ID: 5
browseros-cli snap -p 5 # → [10] textbox Email, [11] textbox Password, [15] button Sign In
browseros-cli fill 10 user@example.com
browseros-cli fill 11 password123
browseros-cli click 15
browseros-cli snap -p 5 # 重新快照!提交后ID已改变
browseros-cli text -p 5 # 读取结果页面
browseros-cli close 5 # 清理
| 类别 | 关键命令 |
|---|---|
| 导航 | open <url>、open --hidden、nav <url>、back、forward、reload、pages、active、close [id] |
| 观察 |
、wait --text| | 输入 | click 、click --double、fill text、clear 、key Enter、hover 、focus 、check 、uncheck 、select val、scroll down [amt]、drag --to 、upload 、dialog accept/dismiss | | 导出 | pdf 、download | | 资源 | window list/create/close/activate、bookmark list/search/create/remove/update/move、history recent/search/delete、group list/create/update/ungroup/close | 完整标志和选项:参见references/cli-commands.md或运行browseros-cli
--help。 常见模式
数据提取
bash browseros-cli open https://example.com/data browseros-cli text # 完整页面以markdown格式输出 browseros-cli text --selector table # 限定到特定元素 browseros-cli text --links # 包含超链接多标签页研究
bash browseros-cli open https://site-a.com # → 页面ID: 1 browseros-cli open https://site-b.com # → 页面ID: 2 browseros-cli text -p 1 # 从第一个提取 browseros-cli text -p 2 # 从第二个提取 browseros-cli close 1 && browseros-cli close 2Web应用测试
bash browseros-cli open http://localhost:3000 browseros-cli snap # 获取交互元素 browseros-cli ss -o test-state.png # 视觉快照 browseros-cli eval document.querySelectorAll(.error).length常见错误
DOM变化后ID失效——重新snap | | 使用eval提取文本 | 改用text或text --selector——更少的token,结构化输出 | | 忘记关闭标签页 | 完成后始终close
错误 修正 使用CSS选择器(fill --selector input[type=email]) 始终先snap,然后使用元素ID(fill 10 text) 在点击或导航后重复使用元素ID 以避免资源泄漏 | | 需要新标签页时使用了nav | nav替换当前标签页。新建标签页请使用open | | 需要留在同一标签页时使用了open | open创建新标签页。原地导航请使用nav | | 为提取内容而截图 | 提取内容请使用text——截图消耗token且需要视觉能力 | | 使用dialog --accept(标志语法) | 正确语法是dialog accept或dialog dismiss(位置参数) | 深入文档
参考文档 描述 references/cli-commands.md 完整命令参考,包含所有标志 链接
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 browseros-agent-1775907429 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 browseros-agent-1775907429 技能
skillhub install browseros-agent-1775907429
文件大小: 5.76 KB | 发布时间: 2026-4-12 09:14