Analyze images and videos using Qwen Vision API (Alibaba Cloud DashScope). Supports image understanding, OCR, visual reasoning.
使用阿里云Qwen Vision API(通义千问视觉模型)分析图片和视频。
分析图片:
bash
uv run {baseDir}/scripts/analyze_image.py --image /path/to/image.jpg --prompt 请描述这张图片 --api-key sk-xxx
使用自定义模型:
bash
uv run {baseDir}/scripts/analyze_image.py --image /path/to/image.jpg --model qwen-vl-max-latest --api-key sk-xxx
从以下位置获取您的API密钥:
| 模型 | 描述 |
|---|---|
| qwen-vl-max-latest | 最新最大模型(默认) |
| qwen-vl-plus-latest |
| 任务 | 提示 |
|---|---|
| 描述 | 请详细描述这张图片的内容 |
| OCR |
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 qwen-vision-1776072008 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 qwen-vision-1776072008 技能
skillhub install qwen-vision-1776072008
文件大小: 4.8 KB | 发布时间: 2026-4-14 10:53