返回顶部
m

mobizen-guiMobizen图形界面

Helps users set up and run MobiZen-GUI to perform mobile-use tasks — automating Android phone operations via natural language. Use when the user wants to control a phone, execute mobile-use tasks, install/configure MobiZen-GUI, deploy MobiZen-GUI-4B model, or customize the agent's input/output. Triggers on keywords like phone task, mobile-use, mobile automation, Android control, MobiZen, ADB, deploy model, run agent, configure model.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
87
下载量
免费
免费
4
收藏
概述
安装方式
版本历史

mobizen-gui

技能名称:mobizen-gui

MobiZen-GUI

基于VLM的移动端自动化框架——通过自然语言控制Android设备。

仓库地址:https://github.com/alibaba/MobiZen-GUI



1. 环境配置

1.1 安装ADB

bash

macOS


brew install android-platform-tools

Linux


sudo apt-get install android-tools-adb

Windows:从 https://developer.android.com/studio/releases/platform-tools 下载


adb version # 验证安装

1.2 连接设备并安装ADBKeyboard

bash
adb devices # USB连接;或:adb tcpip 5555 && adb connect :5555
adb install ADBKeyboard.apk # 从 https://github.com/senzhk/ADBKeyBoard 下载

然后在设备上操作:设置 → 系统 → 语言与输入法 → 虚拟键盘 → 启用ADBKeyboard。

1.3 安装项目

bash
git clone https://github.com/alibaba/MobiZen-GUI.git && cd MobiZen-GUI
pip install -r requirements.txt # openai, pillow, pyyaml



2. 快速开始(仅需配置,无需修改代码)

复制示例配置文件:

bash
cp configexample.yaml myconfig.yaml

只需配置 3个字段 — apikey、baseurl、model_name:

yaml
api_key: your-api-key-here
base_url: https://api.openai.com/v1 # 模型端点地址
model_name: gpt-4o # 模型标识符

如何设置这3个字段:当用户要求执行手机任务但尚未配置时,AI应要求用户提供apikey、baseurl和modelname,然后将它们写入myconfig.yaml。用户也可以手动编辑该文件。任何兼容OpenAI的API均可使用。

提供商示例:

yaml

OpenAI


base_url: https://api.openai.com/v1
api_key: sk-...
model_name: gpt-4o

DeepSeek / Moonshot / 智谱AI 等

base_url: https://api.deepseek.com/v1 api_key: your-key model_name: deepseek-chat

Ollama(本地)

base_url: http://localhost:11434/v1 api_key: dummy model_name: llava

运行:

bash
python main.py --config my_config.yaml --instruction 打开微信并发送消息



3. 配置参考


字段默认值描述
deviceidnull(自动)ADB设备;null表示第一个可用设备
apikey
| 模型API密钥 |
| base_url | null | 模型API端点 |
| model_name | gpt-4o | 模型标识符 |
| model_type | qwen3vl | 坐标系(999x999虚拟空间) |
| max_steps | 25 | 最大执行步数 |
| step_delay | 2.0 | 步骤间延迟(秒) |
| firststepdelay | 4.0 | 第一步后延迟 |
| temperature | 0.1 | 采样温度 |
| top_p | 0.001 | Top-p采样 |
| max_tokens | 1024 | 最大输出令牌数 |
| timeout | 60 | 请求超时时间(秒) |
| use_adbkeyboard | true | 通过ADBKeyboard输入中文文本 |
| screenshot_dir | ./screenshots | 截图保存目录 |


4. 进阶:本地部署MobiZen-GUI-4B

为在中文移动端任务上获得最佳效果,请部署专用4B模型。

4.1 下载模型

bash
pip install -U huggingface_hub

中国镜像(可选)


export HF_ENDPOINT=https://hf-mirror.com
hf download alibabagroup/MobiZen-GUI-4B --local-dir ./MobiZen-GUI-4B

或从ModelScope下载:https://modelscope.cn/models/GUIAgent/MobiZen-GUI-4B

4.2 使用vLLM提供服务

bash
pip install vllm==0.11.0
vllm serve ./MobiZen-GUI-4B --host 0.0.0.0 --port 8000 --trust-remote-code

4.3 将配置指向本地模型

yaml
api_key: dummy
base_url: http://localhost:8000/v1
model_name: MobiZen-GUI-4B
model_type: qwen3vl

然后正常运行:python main.py --config my_config.yaml --instruction ...



5. 自定义(需要修改代码)

该框架采用插件架构——三个组件可通过配置类路径进行替换:

组件角色基类默认实现
MessageBuilder为模型构建提示词和截图core.messagebuilders.base.BaseMessageBuildercore.messagebuilders.qwen.QwenMessageBuilder
ModelClient
调用模型API | core.modelclients.base.BaseModelClient | core.modelclients.openai.OpenAIClient |
| ResponseParser | 解析模型输出→动作 | core.responseparsers.base.BaseResponseParser | core.responseparsers.qwen.QwenResponseParser |

5.1 自定义模型客户端

适用于非OpenAI兼容的API:

python

core/modelclients/myclient.py


from .base import BaseModelClient

class MyClient(BaseModelClient):
def init(self, apikey: str, baseurl: str = None, model: str = , timeout: int = 60):
pass # 初始化客户端

def chat(self, messages, kwargs):
pass # 必须返回包含 .choices[0].message.content 的对象

配置:
yaml
modelclientclass: core.modelclients.myclient.MyClient
modelclientkwargs: {} # 传递给init的额外参数

5.2 自定义消息构建器

用于更改系统提示词或截图/历史记录的格式:

python

core/messagebuilders/mybuilder.py


from .base import BaseMessageBuilder
from utils.image import imagetodata_url

class MyBuilder(BaseMessageBuilder):
def buildsystemprompt(self, kwargs) -> str:
return 你的系统提示词

def buildmessages(self, instruction, currentscreenshot, history, kwargs):
return [{role: system, content: [...]}, {role: user, content: [...]}]

配置:
yaml
messagebuilderclass: core.messagebuilders.mybuilder.MyBuilder

5.3 自定义响应解析器

用于解析不同模型输出格式:

python

core/responseparsers/myparser.py


from .base import BaseResponseParser, ParsedResponse

class MyParser(BaseResponseParser):
def parse(self, response) -> ParsedResponse:
content = response.choices[0].message.content
# 将内容解析为结构化字段
return ParsedResponse(
thought=...,
summary=...,
action={arguments: {action: click, coordinate: [x, y]}},
subtask=...
)

动作字典格式:{arguments: {action: , ...}} — 支持的类型:click、longpress、swipe、type、systembutton、wait、terminate。

配置:
yaml
responseparserclass: core.responseparsers.myparser.MyParser

5.4 添加新动作类型

  1. 1. 在 core/executor/actionexecutor.py 中添加 execute(self, args) 方法
  2. 在 ActionExecutor.execute() 中添加分发分支
  3. 更新 QwenMessageBuilder.buildsystem_prompt() 中的系统提示词

6. 故障排除

  • - 设备未找到:运行 adb devices — 检查USB/无线连接
  • ADBKeyboard不工作:确保在设备设置中已启用;测试:adb shell am broadcast -a ADBINPUTTEXT --es msg test
  • 模型连接错误:验证 baseurl + apikey;

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 mobizen-gui-1776081123 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 mobizen-gui-1776081123 技能

通过命令行安装

skillhub install mobizen-gui-1776081123

下载

⬇ 下载 mobizen-gui v1.0.0(免费)

文件大小: 3.72 KB | 发布时间: 2026-4-14 10:25

v1.0.0 最新 2026-4-14 10:25
- Initial release of mobizen-gui skill.
- Guides users in setting up and running MobiZen-GUI for automating Android phone tasks via natural language.
- Provides step-by-step setup for ADB, device connection, and MobiZen-GUI installation.
- Supports quick configuration with any OpenAI-compatible API.
- Includes advanced instructions for deploying the MobiZen-GUI-4B model locally.
- Explains customization options for prompts, model clients, and action parsers.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部