视觉分析器

通过Ollama云API，利用Kimi K2.5多模态视觉能力分析图像。

使用场景

- 用户想知道图像中的内容
描述截图或照片
理解UI元素、图像中的文字
分析表情包、图表、示意图

快速开始

bash
python3 ~/.openclaw/workspace/skills/vision-analyzer/scripts/vision_analyze.py <图片路径> [提示词]

示例

描述一张图片：
bash
python3 ~/.openclaw/workspace/skills/vision-analyzer/scripts/vision_analyze.py photo.jpg

提出具体问题：
bash
python3 ~/.openclaw/workspace/skills/vision-analyzer/scripts/vision_analyze.py screenshot.png 你看到了哪些UI元素？

常见图片存放位置

- 下载目录：/mnt/chromeos/MyFiles/Downloads/
截图目录：/mnt/chromeos/MyFiles/Downloads/
用户主目录：~/

配置

将你的Ollama API密钥设置为环境变量：

bash
export OLLAMAAPIKEY=你的API密钥

从ollama.com/settings获取你的API密钥

API配置

该技能使用Ollama云API，搭载Kimi K2.5模型。
API密钥从OLLAMAAPIKEY环境变量中读取。

支持的格式

- JPG/JPEG
PNG
GIF
WebP

输出

返回图像内容的自然语言描述。

vision-analyzer视觉分析器

vision-analyzer

Vision Analyzer

When to Use

Quick Start

Examples

Common Image Locations

Configuration

API Configuration

Supported Formats

Output

视觉分析器

使用场景

快速开始

示例

常见图片存放位置

配置

API配置

支持的格式

输出

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

vision-analyzer视觉分析器

vision-analyzer

Vision Analyzer

When to Use

Quick Start

Examples

Common Image Locations

Configuration

API Configuration

Supported Formats

Output

视觉分析器

使用场景

快速开始

示例

常见图片存放位置

配置

API配置

支持的格式

输出

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement