|
通过Ollama云API,利用Kimi K2.5多模态视觉能力分析图像。
bash
python3 ~/.openclaw/workspace/skills/vision-analyzer/scripts/vision_analyze.py <图片路径> [提示词]
描述一张图片:
bash
python3 ~/.openclaw/workspace/skills/vision-analyzer/scripts/vision_analyze.py photo.jpg
提出具体问题:
bash
python3 ~/.openclaw/workspace/skills/vision-analyzer/scripts/vision_analyze.py screenshot.png 你看到了哪些UI元素?
将你的Ollama API密钥设置为环境变量:
bash
export OLLAMAAPIKEY=你的API密钥
从ollama.com/settings获取你的API密钥
该技能使用Ollama云API,搭载Kimi K2.5模型。
API密钥从OLLAMAAPIKEY环境变量中读取。
返回图像内容的自然语言描述。
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 vision-analyzer-1775729940 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 vision-analyzer-1775729940 技能
skillhub install vision-analyzer-1775729940
文件大小: 2.51 KB | 发布时间: 2026-4-11 23:03