返回顶部
v

vision-analysis视觉分析

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
194
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

vision-analysis

视觉分析

使用MiniMax Token计划中可用的MiniMax MiniMaxunderstandimage MCP工具分析图像。

前提条件

  • - 拥有有效MINIMAXAPIKEY的MiniMax Token计划订阅
  • 已配置MiniMax MCP(MiniMaxunderstandimage工具可用)

如果MCP工具未配置

步骤1: 代理应从以下地址获取设置说明:
https://platform.minimaxi.com/docs/token-plan/mcp-guide

步骤2: 检测用户环境(OpenCode、Cursor、Claude Code等)并输出所需的确切命令。常见示例:

OpenCode — 添加到~/.config/opencode/opencode.json或package.json:
json
{
mcp: {
MiniMax: {
type: local,
command: [uvx, minimax-coding-plan-mcp, -y],
environment: {
MINIMAXAPIKEY: YOURTOKENPLAN_KEY,
MINIMAXAPIHOST: https://api.minimaxi.com
},
enabled: true
}
}
}

Claude Code
bash
claude mcp add -s user MiniMax --env MINIMAXAPIKEY=your-key --env MINIMAXAPIHOST=https://api.minimaxi.com -- uvx minimax-coding-plan-mcp -y

Cursor — 添加到MCP设置:
json
{
mcpServers: {
MiniMax: {
command: uvx,
args: [minimax-coding-plan-mcp],
env: {
MINIMAXAPIKEY: your-key,
MINIMAXAPIHOST: https://api.minimaxi.com
}
}
}
}

步骤3: 配置完成后,告知用户重启其应用并使用/mcp进行验证。

重要提示: 如果用户没有MiniMax Token计划订阅,请告知他们understand_image工具需要该订阅——无法使用免费或其他级别的API密钥。

分析模式

模式使用场景提示策略
describe通用图像理解要求详细描述
ocr
从截图、文档中提取文本 | 要求逐字提取所有文本 | | ui-review | UI模型、线框图、设计文件 | 要求提供设计评审及建议 | | chart-data | 图表、图形、数据可视化 | 要求提取数据点和趋势 | | object-detect | 识别物体、人物、活动 | 要求列出并定位所有元素 |

工作流程

步骤1:自动检测图像

当消息包含以下扩展名的图像文件路径或URL时,技能自动触发:
.jpg、.jpeg、.png、.gif、.webp、.bmp、.svg

从消息中提取图像路径。

步骤2:选择分析模式并调用MCP工具

使用MiniMaxunderstandimage工具,配合特定模式的提示:

describe:

请详细描述此图像。包括:主要主体、场景/背景、
颜色/风格、任何可见文本、显著物体以及整体构图。

ocr:

逐字提取此图像中所有可见文本。保留结构和格式
(标题、列表、列)。如果未找到文本,请说明。

ui-review:

你是一名UI/UX设计评审员。分析此界面模型或设计。提供:
(1) 优点——哪些地方做得好,(2) 问题——可用性或设计问题,
(3) 具体、可操作的改进建议。请保持建设性和详细性。

chart-data:

从此图表或图形中提取所有数据。列出:图表标题、轴标签、所有
数据点/系列及其数值(如可读),以及趋势的简要总结。

object-detect:

列出你能识别的所有不同物体、人物和活动。对每个元素,
描述其是什么以及其在图像中的大致位置。

步骤3:呈现结果

清晰返回分析结果。对于describe模式,使用可读的散文。对于ocr模式,保留结构。对于ui-review模式,使用结构化的评审格式。

输出格式示例

对于describe模式:

图像描述

[图像内容的详细描述...]

对于ocr模式:

提取的文本

[从图像中保留的文本结构]

对于ui-review模式:

UI设计评审

优点

  • - ...

问题

  • - ...

建议

  • - ...

注意事项

  • - 支持最大20MB的图像(JPEG、PNG、GIF、WebP)
  • 如果MiniMax MCP配置了文件访问权限,本地文件路径也可使用
  • MiniMaxunderstandimage工具由minimax-coding-plan-mcp包提供

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 minimax-vision-analysis-1775911212 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 minimax-vision-analysis-1775911212 技能

通过命令行安装

skillhub install minimax-vision-analysis-1775911212

下载

⬇ 下载 vision-analysis v1.0.0(免费)

文件大小: 2.98 KB | 发布时间: 2026-4-12 10:36

v1.0.0 最新 2026-4-12 10:36
Initial release of vision-analysis skill.

- Enables image analysis via the MiniMax_understand_image MCP tool for general description, OCR, UI review, chart data extraction, and object detection modes.
- Automatically triggers on image file uploads/links or relevant analysis requests.
- Includes guidance for MiniMax MCP setup across OpenCode, Cursor, and Claude Code environments.
- Provides mode-specific prompt strategies and structured output formats for clear results.
- Supports common image formats and local file paths (with appropriate MCP configuration).

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部