返回顶部
g

ghosthand幽灵手操作

Use this skill when operating Ghosthand, a local Android control runtime exposed over a loopback HTTP API for OpenClaw or another agent. Trigger it for Ghosthand tasks involving runtime or capability checks, structured UI inspection, selector planning, semantic clicks, coordinate taps, text input, scrolling, wait conditions, clipboard transfer, notifications, screenshots, or debugging Ghosthand-specific route behavior such as partial-output warnings, snapshot-scoped node IDs, or text vs content

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.5
安全检测
已通过
177
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ghosthand

Ghosthand

Ghosthand 是安卓手机上的一个回环 HTTP 服务器。所有交互均通过 HTTP 的 GET、POST 以及少量 DELETE 请求发送至 http://127.0.0.1:5583。

始终优先执行以下步骤:

步骤命令目的
1GET /pingGhosthand 是否存活?
2
GET /state | 运行时是否健康,所需能力当前是否可用? |
| 3 | GET /screen?source=accessibility | 当前可操作的界面是什么? |

使用此技能将 Ghosthand 作为安卓代理基础进行操作。

Ghosthand 并非通用的安卓建议。它是一个具有基于路由控制面的本地运行时。仅当任务确实涉及 Ghosthand 路由、Ghosthand 能力状态或通过 Ghosthand 执行操作时,才使用此技能。

Ghosthand 是什么

Ghosthand 为安卓观察和控制暴露了一个本地 HTTP API。重要的类别包括:

  • - 运行时与健康状态:/ping、/health、/state、/device、/foreground、/commands、/capabilities
  • 结构化 UI 检查:/screen、/tree、/focused、/find
  • 语义或坐标交互:/click、/tap、/input、/type、/setText、/scroll、/swipe、/longpress、/gesture
  • 应用与导航控制:/back、/home、/recents
  • 感知与传输:/screenshot、/wait、/clipboard、/notify

当路由细节重要时,将 /commands 视为当前机器可读的能力目录。

何时使用此技能

当任务需要以下任何一项时使用:

  • - 检查 Ghosthand 是否正在运行或已就绪
  • 检查某项能力是否既获得安卓授权又被 Ghosthand 策略允许
  • 在操作前检查当前安卓界面
  • 通过 text、desc 或 id 查找或点击 UI 目标
  • 从 Ghosthand 未命中或模糊的操作结果中恢复
  • 使用 Ghosthand 进行输入、滚动、滑动、等待、读取剪贴板或读取通知
  • 调试 Ghosthand 特定行为,例如部分输出、关于选择器的过时假设或快照作用域内的节点 ID

不要将其用于:

  • - 与 Ghosthand 无关的通用安卓使用建议
  • Ghosthand 未暴露的仅 root 方法
  • 当 /commands 可以直接回答时,使用虚构的路由或未记录的行为

操作模型

1. 从事实出发,而非意图

在操作之前,确认三件事:

  1. 1. Ghosthand 是否存活且可用?
  2. 当前实际可见的界面是什么?
  3. 对于目标,哪个选择器界面和路由形状最合理?

典型顺序:

  1. 1. 读取 /ping
  2. 读取 /state
  3. 如果路由形状、选择器支持或响应字段不确定,读取 /commands
  4. 读取 /screen?source=accessibility 获取当前可操作界面
  5. 如果无障碍读取不可用或明显不足,使用 /screen?source=hybrid 或 /screen?source=ocr 重试
  6. 然后才选择 /find、/click 或 /tap

2. 能力访问有两层

一项能力仅在以下两者都为真时才可用:

  • - 安卓/系统授权存在
  • Ghosthand 策略允许该能力

不要将权限已授予与当前可用混淆。在诊断失败之前读取 /state,特别是对于无障碍和截图捕获。

/state 是最佳的实时摘要。当代理需要路由-能力映射和可用性详情时,/capabilities 是更完整的目录式视图。

3. 节点 ID 是快照作用域内的

将 nodeId 视为临时性的。除非快照上下文明显相同,否则不要跨新的观察结果缓存它。优先通过 /screen、/find 或基于选择器的 /click 重新解析,而不是假设旧的节点 ID 仍然有效。

原语选择

/screen

当需要紧凑的可操作视图时,首先使用 /screen。默认模式是 source=accessibility。

使用它来回答:

  • - 当前可见什么
  • 哪些元素是可操作的、可编辑的或可滚动的
  • 坐标是否足够可信以用于 /tap
  • 当前界面是否包含目标

重要细节:

  • - source=accessibility 是默认值,支持 editable、scrollable、clickable 和 package 过滤器
  • 当无障碍暂时不可用或操作上不足时,source=hybrid 或 source=ocr 很有用
  • summaryOnly=true 用于紧凑定位,而非详细定位
  • previewPath 是一个提示,表明轻量级截图获取可用;/screen 不嵌入图像字节

如果 /screen 报告 partialOutput=true、警告、前台漂移或回退提示,不要假设你看到了整个界面。在归咎于应用之前,升级到 /tree、/screenshot 或非无障碍屏幕模式。

/tree

当需要更完整的结构、原始层次结构或检查为什么 /screen 可能省略或塑造了输出时,使用 /tree。将其用于诊断和结构事实,而不是作为默认的首次读取。

/find

当已经有了选择器假设并希望进行有界查找时,使用 /find。

当需要以下内容时优先使用:

  • - 交互前的选择器测试
  • 通过 index 消除歧义
  • 在坐标回退之前确认目标存在
  • 检查可见标签是否可通过 text、contentDesc、resourceId 发现,或者仅作为焦点节点

未命中通常意味着以下四种情况之一:

  • - 错误的界面
  • 错误的选择器界面
  • 错误的匹配语义
  • 目标未以你假设的方式暴露

支持的策略是 text、textContains、contentDesc、contentDescContains、resourceId 和 focused。text、desc 和 id 是请求体中的便利别名;Ghosthand 内部会将其规范化。

/click

当有合理的语义目标时,优先使用 /click 而非 /tap。Ghosthand 可以解析包装目标、有界选择器回退和可点击的祖先,然后暴露它如何实际落在一个可操作的节点上。

首先使用 /click 的场景:

  • - 文本标签控件
  • 内容描述标签控件
  • 稳定的资源 ID
  • 祖先点击解析可能有帮助的情况

对于基于选择器的 /click,除非你明确设置 clickable=false,否则 Ghosthand 默认将 clickable=true 作为默认值。该默认值针对操作进行了优化,而非检查。当你需要检查原始匹配节点时,使用 /find 或禁用可点击解析。

/tap

仅当坐标来自当前可信界面时才使用 /tap。不要猜测坐标。只有在语义定位缩小了不确定性之后,坐标回退才是合理的。

/input 和 /setText

对焦点可编辑字段使用 /input。当需要显式文本变更或 Enter 键发送语义时,优先使用它而非 /type。

仅当当前焦点已经正确且需要更简单的焦点文本输入时,使用 /type。

仅当拥有可信的同一快照可编辑 nodeId 并需要定位到该确切节点时,使用 /setText。

输入文本时,不要假设 Enter 键会成功提交或确认输入。如果 Enter 键不起作用或字段仍未提交,请改用屏幕上的 IME 确认操作,通常是键盘右下角的确认按钮。

/scroll 和 /swipe

当目标是容器移动或列表推进时,使用 /scroll。

当任务确实是几何操作时,使用 /swipe。

不要将 performed=true 解释为内容已更改的证据。检查返回的更改字段,然后通过 /screen、/tree 或 /wait 进行验证。

/wait

在可能改变 UI 状态的操作之后使用 /wait。

有两种不同的用途:

  • - GET /wait:等待 UI 变化并检查最终稳定状态
  • POST /wait:等待选择器条件

不要将 changed=false 与操作失败混淆。它仅意味着在等待窗口期间未观察到转换。在断定操作失败之前,重新检查最终界面。

对于 POST /wait,支持的策略是有界的,查询规则很重要:focused 不带查询,而文本/内容描述/资源 ID 等待需要查询。

/clipboard、/notify、/screenshot

将 /clipboard 用作长文本或重复输入的传输原语。

仅当任务明确与通知

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ghosthand-skill-1775938502 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ghosthand-skill-1775938502 技能

通过命令行安装

skillhub install ghosthand-skill-1775938502

下载

⬇ 下载 ghosthand v1.0.5(免费)

文件大小: 6.7 KB | 发布时间: 2026-4-12 10:05

v1.0.5 最新 2026-4-12 10:05
No code changes detected; documentation update only.

- Clarified endpoint details and added mention of `DELETE` routes.
- Updated initial usage steps, specifying `GET /screen?source=accessibility`.
- Expanded descriptions of `/screen`, `/find`, `/click`, `/tap`, `/input`, `/type`, and `/setText`.
- Added notes on `/screen` source options (`accessibility`, `hybrid`, `ocr`) and selector normalization.
- Improved guidance on capability checks and the use of `/state` vs `/capabilities`.
- Refined recovery and selection rules to improve agent reliability.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部