返回顶部
g

glmv-caption智谱生成描述

Generate captions (descriptions) for images, videos, and documents using ZhiPu

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
427
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

glmv-caption

GLM-V 描述技能

使用智谱GLM-V多模态模型为图片、视频和文档生成描述。

使用场景

  • - 描述、标注、总结或解读图片/视频/文档内容
  • 用户提及描述这张图片、标注、总结这个视频、图片描述、视频摘要、文档解读、看图说话
  • 从媒体文件中提取视觉或文本信息
  • 比较多张图片
  • 用户提供图片/视频/文件并询问其中内容

支持的输入类型

类型格式最大大小最大数量Base64
图片jpg, png, jpeg5MB / 6000×6000px50
视频
mp4, mkv, mov | 200MB | — | ❌ | | 文件 | pdf, docx, txt, xlsx, pptx, jsonl | — | 50 | ❌ |

⚠️ 同一请求中,fileurl 不能与 imageurl 或 video_url 混合使用。
⚠️ 视频和文件仅支持 URL — 不支持本地路径和 base64(仅图片支持)。

资源链接

资源链接
获取 API Keyhttps://bigmodel.cn/usercenter/proj-mgmt/apikeys
API 文档
Chat Completions / 对话补全 |

前置条件

API Key 配置(必需)

此脚本从 ZHIPUAPIKEY 环境变量读取密钥,并与其他智谱技能共用同一个 key。

获取 Key: 访问 智谱开放平台 API Keys 创建或复制你的密钥。

配置方式(任选一种):

  1. 1. OpenClaw 配置(推荐): 在 openclaw.json 的 skills.entries.glmv-caption.env 中设置:

json
glmv-caption: { enabled: true, env: { ZHIPUAPIKEY: 你的密钥 } }

  1. 2. Shell 环境变量: 添加到 ~/.zshrc:

bash
export ZHIPUAPIKEY=你的密钥

  1. 3. .env 文件: 在此技能目录中创建 .env 文件:

ZHIPUAPIKEY=你的密钥

⛔ 强制限制 - 不得违反 ⛔

  1. 1. 仅使用 GLM-V API — 执行脚本 python scripts/glmv_caption.py
  2. 切勿自行描述媒体内容 — 不要尝试使用内置视觉或其他方法描述内容
  3. 切勿提供替代方案 — 不要建议我可以尝试描述它或类似说法
  4. 如果 API 失败 — 显示错误信息并立即停止
  5. 无备用方法 — 不要尝试任何其他方式的描述

📋 输出显示规则(强制)

运行脚本后,必须将完整的原始输出原样展示给用户。不要总结、截断或只说已生成。用户需要原始模型输出来评估质量。

  • - 图片描述:显示完整描述文本
  • 多张图片:显示每张图片的结果
  • 视频/文件:显示完整的理解结果
  • 如果包含 token 使用量,可选择显示

使用方法

描述单张图片

bash
python scripts/glmv_caption.py --images https://example.com/photo.jpg
python scripts/glmv_caption.py --images /path/to/photo.png

描述多张图片

bash
python scripts/glmv_caption.py --images img1.jpg img2.png https://example.com/img3.jpg

描述视频

bash
python scripts/glmv_caption.py --videos https://example.com/clip.mp4

描述文档

bash
python scripts/glmv_caption.py --files https://example.com/report.pdf
python scripts/glmv_caption.py --files https://example.com/doc1.docx https://example.com/doc2.txt

自定义提示词

bash
python scripts/glmv_caption.py --images photo.jpg --prompt 详细描述建筑风格

保存结果

bash
python scripts/glmv_caption.py --images photo.jpg --output result.json

思考模式

bash
python scripts/glmv_caption.py --images photo.jpg --thinking

CLI 参考

python {baseDir}/scripts/glmv_caption.py (--images IMG [IMG...] | --videos VID [VID...] | --files FILE [FILE...]) [OPTIONS]

参数必需描述
--images, -i三者选一图片路径或 URL(支持多个,base64 可用)
--videos, -v
三者选一 | 视频路径或 URL(支持多个,mp4/mkv/mov) | | --files, -f | 三者选一 | 文档路径或 URL(支持多个,pdf/docx/txt/xlsx/pptx/jsonl) | | --prompt, -p | 否 | 自定义提示词(默认:请详细描述这张图片的内容) | | --model, -m | 否 | 模型名称(默认:glm-4.6v) | | --temperature, -t | 否 | 采样温度 0-1(默认:0.8) | | --top-p | 否 | 核采样 0.01-1.0(默认:0.6) | | --max-tokens | 否 | 最大输出 token 数(默认:1024,最大 32768) | | --thinking | 否 | 启用思考/推理模式 | | --output, -o | 否 | 将结果保存为 JSON 文件 | | --pretty | 否 | 美化 JSON 输出 | | --stream | 否 | 启用流式输出 |

注意: 根据 API 限制,--images、--videos 和 --files 互斥。

响应格式

json
{
success: true,
caption: 一张展现日落时分山脉景观的照片...,
usage: {
prompt_tokens: 128,
completion_tokens: 256,
total_tokens: 384
}
}

关键字段:

  • - success — 请求是否成功
  • caption — 生成的描述文本
  • usage — token 使用统计
  • warning — 当内容被安全审查拦截时出现
  • error — 失败时的错误详情

错误处理

API key 未配置:

ZHIPUAPIKEY 未配置。请在以下地址获取 API Key:https://bigmodel.cn/usercenter/proj-mgmt/apikeys

→ 向用户显示确切错误,引导其进行配置

认证失败(401/403): API key 无效/已过期 → 重新配置

速率限制(429): 配额已用完 → 告知用户等待

文件未找到: 本地文件缺失 → 检查路径

内容被过滤: 出现 warning 字段 → 内容被安全审查拦截

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 glmv-caption-1776208022 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 glmv-caption-1776208022 技能

通过命令行安装

skillhub install glmv-caption-1776208022

下载

⬇ 下载 glmv-caption v1.0.2(免费)

文件大小: 8.55 KB | 发布时间: 2026-4-17 14:57

v1.0.2 最新 2026-4-17 14:57
## glmv-caption 1.0.2 Changelog

- No file changes were detected in this version.
- Documentation and usage instructions remain the same.
- No new features, bug fixes, or behavioral adjustments reported for this release.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部