返回顶部
a

agent-desktop智能桌面代理

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.8
安全检测
已通过
453
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

agent-desktop

agent-desktop

CLI工具,使AI代理能够通过原生操作系统无障碍树观察和控制桌面应用程序。

核心原则: agent-desktop 不是AI代理。它是AI代理调用的工具。它输出带有基于引用的元素标识符的结构化JSON。观察-行动循环存在于调用代理中。

安装

bash
npm install -g agent-desktop


bun install -g --trust agent-desktop

需要macOS 12+,且终端已授予无障碍权限。

参考文件

详细文档分为多个重点参考文件。按需阅读:

参考文件内容
references/commands-observation.mdsnapshot、find、get、is、screenshot、list-surfaces — 所有标志、输出示例
references/commands-interaction.md
click、type、set-value、select、toggle、scroll、drag、keyboard、mouse — 选择正确的命令 |
| references/commands-system.md | launch、close、windows、clipboard、wait、batch、status、permissions、version |
| references/workflows.md | 12种常见模式:表单、菜单、对话框、滚动查找、拖放、异步等待、反模式 |
| references/macos.md | macOS权限/TCC、AX API内部原理、智能激活链、表面、通知中心、故障排除 |

观察-行动循环

每个自动化都遵循此模式:

  1. 1. 观察 → agent-desktop snapshot --app App Name -i
  2. 推理 → 解析JSON,通过引用(@e1、@e2...)查找目标元素
  3. 行动 → agent-desktop click @e5(或type、select、toggle...)
  4. 验证 → 再次运行agent-desktop snapshot确认状态变化
  5. 重复 → 继续直到任务完成

始终在行动前进行快照。引用是快照作用域的,UI变化后失效。

引用系统

  • - 引用按深度优先分配:@e1、@e2、@e3...
  • 只有交互元素获得引用:按钮、文本字段、复选框、链接、菜单项、选项卡、滑块、组合框、树项、单元格
  • 静态文本、组、容器保留在树中作为上下文,但没有引用
  • 引用在快照内是确定性的,但如果UI发生变化,跨快照不稳定
  • 任何改变UI的操作后,重新运行snapshot获取新引用

JSON输出契约

每个命令在标准输出上返回JSON信封:

成功: { version: 1.0, ok: true, command: snapshot, data: { ... } }
错误: { version: 1.0, ok: false, command: click, error: { code: STALE_REF, message: ..., suggestion: ... } }

退出码:0成功,1结构化错误,2参数错误。

错误码

含义恢复方法
PERMDENIED未授予无障碍权限在系统设置 > 隐私 > 无障碍中授予
ELEMENTNOT_FOUND
引用不在当前引用映射中 | 重新运行快照,使用新引用 | | APPNOTFOUND | 应用未运行 | 先启动它 | | ACTION_FAILED | AX操作被拒绝 | 尝试替代方法或基于坐标的点击 | | ACTIONNOTSUPPORTED | 元素无法执行此操作 | 使用不同命令 | | STALE_REF | 来自旧快照的引用 | 重新运行快照 | | WINDOWNOTFOUND | 没有匹配的窗口 | 检查应用名称,使用list-windows | | TIMEOUT | 等待条件未满足 | 增加--timeout | | INVALID_ARGS | 参数错误 | 检查命令语法 |

命令快速参考(54个命令)

观察

agent-desktop snapshot --app App -i # 带引用的无障碍树
agent-desktop screenshot --app App out.png # PNG截图
agent-desktop find --app App --role button # 搜索元素
agent-desktop get @e1 --property text # 读取元素属性
agent-desktop is @e1 --property enabled # 检查元素状态
agent-desktop list-surfaces --app App # 可用表面

交互

agent-desktop click @e5 # 点击元素
agent-desktop double-click @e3 # 双击
agent-desktop triple-click @e2 # 三击(选择行)
agent-desktop right-click @e5 # 右键点击(上下文菜单)
agent-desktop type @e2 hello # 向元素输入文本
agent-desktop set-value @e2 new value # 直接设置值
agent-desktop clear @e2 # 清除元素值
agent-desktop focus @e2 # 设置键盘焦点
agent-desktop select @e4 Option B # 选择下拉选项
agent-desktop toggle @e6 # 切换复选框/开关
agent-desktop check @e6 # 幂等勾选
agent-desktop uncheck @e6 # 幂等取消勾选
agent-desktop expand @e7 # 展开披露控件
agent-desktop collapse @e7 # 折叠披露控件
agent-desktop scroll @e1 --direction down # 滚动元素
agent-desktop scroll-to @e8 # 滚动到视图中

键盘与鼠标

agent-desktop press cmd+c # 组合键
agent-desktop press return --app App # 定向按键
agent-desktop key-down shift # 按住键
agent-desktop key-up shift # 释放键
agent-desktop hover @e5 # 光标移到元素
agent-desktop hover --xy 500,300 # 光标移到坐标
agent-desktop drag --from @e1 --to @e5 # 元素间拖放
agent-desktop mouse-click --xy 500,300 # 在坐标处点击
agent-desktop mouse-move --xy 100,200 # 移动光标
agent-desktop mouse-down --xy 100,200 # 按下鼠标按钮
agent-desktop mouse-up --xy 300,400 # 释放鼠标按钮

应用与窗口

agent-desktop launch System Settings # 启动并等待
agent-desktop close-app TextEdit # 优雅退出
agent-desktop close-app TextEdit --force # 强制终止
agent-desktop list-windows --app Finder # 列出窗口
agent-desktop list-apps # 列出运行中的GUI应用
agent-desktop focus-window --app Finder # 置于前台
agent-desktop resize-window --app App --width 800 --height 600
agent-desktop move-window --app App --x 0 --y 0
agent-desktop minimize --app App
agent-desktop maximize --app App
agent-desktop restore --app App

通知

agent-desktop list-notifications # 列出所有通知
agent-desktop list-notifications --app Slack # 按应用筛选
agent-desktop list-notifications --text deploy --limit 5 # 按文本筛选
agent-desktop dismiss-notification 1 # 按索引关闭
agent-desktop dismiss-all-notifications # 关闭所有
agent-desktop dismiss-all-notifications --app Slack # 关闭应用的所有通知
agent-desktop notification-action 1 --action Reply # 点击操作按钮

剪贴板

agent-desktop clipboard-get # 读取剪贴板
agent-desktop clipboard-set text # 写入剪贴板
agent-desktop clipboard-clear # 清空剪贴板

等待

agent-desktop wait 1000 # 暂停1秒
agent-desktop wait --element @e5 --timeout 5000 # 等待元素
agent-desktop wait --window Title # 等待窗口
agent-desktop wait --text Done --app App # 等待文本
agent-desktop wait --menu --app App # 等待上下文菜单
agent-desktop wait --menu-closed --app App # 等待菜单关闭
agent-desktop wait --notification --app App # 等待新通知

系统

agent-desktop status # 健康检查
agent-desktop permissions # 检查权限
agent-desktop permissions --request # 触发权限对话框
agent-desktop version --json # 版本信息
agent-desktop batch [...] --stop-on

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 agent-desktop-1776276279 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 agent-desktop-1776276279 技能

通过命令行安装

skillhub install agent-desktop-1776276279

下载

⬇ 下载 agent-desktop v0.1.8(免费)

文件大小: 16.46 KB | 发布时间: 2026-4-16 18:30

v0.1.8 最新 2026-4-16 18:30
agent-desktop v0.1.8

- Added detailed SKILL.md documentation covering installation, usage principles, command reference, error codes, and recovery steps.
- Provides an overview of 54 CLI commands across observation, interaction, keyboard/mouse, app/window management, notifications, and clipboard.
- Clarifies ref-based element identification and the recommended observe-act loop for reliable automation.
- Documents macOS support (Phase 1) and notes plans for Windows and Linux compatibility.
- Explains JSON output format and structured error handling for all commands.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部