返回顶部
c

clawdcursor 爪形光标

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.7.5
安全检测
已通过
153
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

clawdcursor

技能名称:clawdcursor

如果人类能在屏幕上完成的操作,你也能做到。 没有API?没有集成?没问题。

作为备选方案使用 — 非首选
在使用任何ClawdCursor工具之前,请问:

  1. 1. 是否有原生API?(Gmail API、GitHub API、Slack API)→ 使用API
  2. 是否有CLI?(git、npm、curl)→ 使用CLI
  3. 能否直接编辑文件?→ 直接编辑
  4. 是否有浏览器自动化层?(Playwright、Puppeteer)→ 使用自动化层

以上都不行?现在使用ClawdCursor。 它用于最后一公里。


模式概览

模式命令大脑可用工具
serveclawdcursor serve(REST客户端)全部42个工具,通过HTTP
mcp
clawdcursor mcp | (MCP客户端) | 全部42个工具,通过MCP stdio | | start | clawdcursor start | 内置LLM管道 | 全部42个工具 + 自主代理 |

在serve和mcp模式下:你负责推理,ClawdCursor负责执行。 没有内置LLM。你调用工具,解释结果,决定下一步。



连接

选项A — REST(clawdcursor serve)

bash
clawdcursor serve # 启动于 http://127.0.0.1:3847

所有POST端点需要:Authorization: Bearer (令牌保存至~/.clawdcursor/token)

GET /tools → 所有工具架构(OpenAI函数调用格式)
POST /execute/{name} → 运行工具:{param: value}
GET /health → {status:ok,version:0.7.5}
GET /docs → 完整文档

示例:

POST /execute/get_windows {}
POST /execute/mouse_click {x: 640, y: 400}
POST /execute/type_text {text: hello world}

如果服务器未运行,请自行启动 — 不要询问用户:
bash
clawdcursor serve

等待2秒,然后验证:GET /health

选项B — MCP(clawdcursor mcp)

json
{
mcpServers: {
clawdcursor: {
command: clawdcursor,
args: [mcp]
}
}
}

适用于Claude Code、Cursor、Windsurf、Zed或任何兼容MCP的客户端。全部42个工具以相同方式暴露。

选项C — 自主代理(clawdcursor start)

POST /task {task: 打开记事本并写入Hello} → 提交任务
GET /status → {status: acting} | idle | waiting_confirm
POST /confirm {approved: true} → 批准安全门控操作
POST /abort → 停止当前任务

使用delegatetoagent工具从MCP/REST会话中提交任务。需要在端口3847上运行clawdcursor start。

轮询模式:

POST /task {task: ..., returnPartial: true}
→ 每2秒轮询GET /status:
acting → 仍在运行,继续轮询
waiting_confirm → 停止。询问用户 → POST /confirm {approved: true}
idle → 完成,检查GET /task-logs获取结果
→ 如果60秒以上无进展:POST /abort,用更简单的措辞重试

returnPartial模式 — 在POST /task中发送{returnPartial: true}:
如果阶段2失败,ClawdCursor跳过阶段3(昂贵的视觉处理)并将控制权返回给你:
json
{partial: true, stepsCompleted: [...], context: 在对话框处卡住}

你使用MCP工具完成任务,然后调用POST /learn保存有效的方法。

POST /learn — 自适应学习:
使用自己的工具调用完成任务后,教导ClawdCursor以备下次使用:
json
POST /learn
{
processName: EXCEL,
task: 创建带表头的表格,
actions: [
{action: key, description: Ctrl+Home跳转到A1},
{action: type, description: 输入表头名称},
{action: key, description: Tab跳转到下一列}
],
shortcuts: {nextcell: Tab, nextrow: Enter},
tips: [列之间使用Tab,行之间使用Enter]
}

这会丰富应用的指南JSON。阶段2在下次运行时读取它 — 无需视觉回退。



通用循环

无论传输方式如何,每个GUI任务都遵循相同模式:

  1. 1. 定位 → readscreen() 或 getwindows() 查看打开和聚焦的内容
  2. 操作 → smartclick() / smarttype() / key_press() 执行操作
  3. 验证 → 检查返回值 → 窗口状态 → 文本检查 → 截图
  4. 重复 → 直到完成

验证(从最便宜到最昂贵)

  1. 1. 工具返回值 — 每个工具报告成功/失败。首先检查。
  2. 窗口状态 — getactivewindow()、getwindows() — 对话框出现了吗?标题改变了吗?
  3. 文本检查 — readscreen() 或 smartread() — 预期文本可见吗?
  4. 截图 — desktopscreenshot() — 仅在文本方法失败时使用。成本最高。
  5. 负面检查 — 查找错误对话框、错误窗口、未改变的屏幕。

始终验证在:发送、保存、删除、表单提交之后。
跳过验证在:序列中的中间按键、滚动。



工具决策树

感知 — 始终从这里开始

read_screen() → 首选。无障碍树:按钮、输入框、文本,带坐标。
快速、结构化,适用于原生应用。
ocrreadscreen() → 当无障碍树为空时(画布UI、基于图像的应用)。
smart_read() → 结合OCR + 无障碍。不确定时优先调用。
desktop_screenshot() → 最后手段。仅当需要像素级视觉细节时。
desktopscreenshotregion(x,y,w,h) → 放大裁剪,当需要某个区域的细节时。

点击

smart_click(保存) → 首选。通过OCR + 无障碍按标签/文本查找并点击。
传递processId以定位正确的窗口。
invokeelement(name=保存) → 当你知道来自readscreen的确切自动化ID时。
cdpclick(text=提交) → 浏览器元素。需要先cdpconnect()。
mouse_click(x, y) → 最后手段。来自截图的原始坐标。

输入

smart_type(邮箱, user@x.com) → 首选。按标签查找字段,聚焦,输入。
cdptype(label=邮箱, text=…) → 浏览器输入。需要先cdpconnect()。
type_text(hello) → 剪贴板粘贴到当前聚焦的元素。
在手动使用smart_click聚焦后使用。

浏览器 / CDP

  1. 1. navigatebrowser(url) → 打开URL,自动启用CDP
  2. cdpconnect() → 连接到浏览器DevTools协议
  3. cdppagecontext() → 列出页面上的交互元素
  4. cdpreadtext() → 提取DOM文本(画布应用返回空 → 使用OCR)
  5. cdpclick(text=…) → 按可见文本点击
  6. cdptype(label, text) → 按标签填充输入框
  7. cdpevaluate(script) → 在页面上下文中运行JavaScript
  8. cdpscroll(direction, px) → 通过DOM滚动页面(非鼠标滚轮)
  9. cdplisttabs() → 列出所有打开的标签页
  10. cdpswitchtab(target) → 切换到特定标签页

如果CDP未连接,使用键盘切换标签页:

key_press(ctrl+1) → 标签页1
key_press(ctrl+tab) → 下一个标签页
key_press(ctrl+shift+tab) → 上一个标签页

窗口管理

get_windows() → 列出所有打开的窗口(用于查找PID)
getactivewindow() → 当前

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 clawdcursor-1776419971 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 clawdcursor-1776419971 技能

通过命令行安装

skillhub install clawdcursor-1776419971

下载

⬇ 下载 clawdcursor v0.7.5(免费)

文件大小: 7.47 KB | 发布时间: 2026-4-17 19:09

v0.7.5 最新 2026-4-17 19:09
Clawd Cursor 0.7.5 — No code changes in this release.

- Version increment only; no file or feature changes detected.
- Behavior and interface remain identical to previous version (0.6.3).

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部