CogView-3-Flash Skill
基于智谱/BigModel 的 cogview-3-flash 文生图接口,提供快速单张图片生成能力。
Features
- - 使用
https://open.bigmodel.cn/api/paas/v4/images/generations 接口 - 支持通过环境变量
ZHIPU_API_KEY 配置鉴权 Token - 支持
cogview-3-flash 与 glm-image 两类模型 - 作为 OpenClaw Skill 使用:当用户在对话中请求生成图片时,由 Agent 调用本技能,自动执行
scripts/generate.py,根据提示词和尺寸生成图片并返回本地文件路径 - 简单参数:提示词、尺寸、水印开关
Setup
- 1. 从对应平台控制台获取 API Key/Token
- 在终端中设置环境变量:
CODEBLOCK0
或在工具配置中以同名变量注入。
Models & Sizes
在脚本中通过 --model 选择模型:
- -
cogview:对应 cogview-3-flash(默认) - INLINECODE9 :对应 INLINECODE10
各模型推荐尺寸与限制:
- -
glm-image 推荐枚举值:1280x1280(默认), 1568x1056, 1056x1568, 1472x1088, 1088x1472, 1728x960, INLINECODE18
自定义尺寸: 长宽推荐在
1024px-2048px 范围内, 最大像素数不超过
2^22,长宽需为
32 的整数倍。
- - 其它模型(如
cogview-3-flash)推荐枚举值:1024x1024(默认), 768x1344, 864x1152, 1344x768, 1152x864, 1440x720, INLINECODE29
自定义尺寸: 长宽需在
512px-2048px 范围内, 最大像素数不超过
2^21,长宽需为
16 的整数倍。
Usage
命令行生成图片
CODEBLOCK1
参数说明
- -
prompt:必填,中文或英文提示词 - INLINECODE34 :模型选择,
cogview(默认)/ INLINECODE36 - INLINECODE37 :图片尺寸,不传则使用所选模型默认尺寸
- INLINECODE38 :开启水印(默认开启)
- INLINECODE39 :关闭水印
- INLINECODE40 /
-o:指定输出文件名,默认自动生成
API 行为说明
CODEBLOCK2
- - 本 Skill 会自动解析
data[0].url,下载图片并保存到本地。
在 Feishu 中的使用(给 Agent 的操作指引)
当用户在 Feishu 对话中请求你生成图片时,请按下面步骤操作:
- 1. 使用系统运行工具,在
{baseDir} 目录下执行命令,根据用户的提示词和期望尺寸构造参数,例如:
- INLINECODE44
- 2. 从脚本标准输出中找到形如
✅ 图片已保存: /path/to/image.png 的一行,并解析出其中的本地图片路径。 - 使用 Feishu 的发送图片能力,将该图片文件直接作为图片消息发送到当前会话,而不是只把本地路径文本返回给用户。
- 在文字回复中简单说明图片信息(模型、尺寸、提示词等),同时附上生成的图片。
示例
CODEBLOCK3
CogView-3-Flash 技能
基于智谱/BigModel 的 cogview-3-flash 文生图接口,提供快速单张图片生成能力。
功能特性
- - 使用 https://open.bigmodel.cn/api/paas/v4/images/generations 接口
- 支持通过环境变量 ZHIPUAPIKEY 配置鉴权 Token
- 支持 cogview-3-flash 与 glm-image 两类模型
- 作为 OpenClaw 技能使用:当用户在对话中请求生成图片时,由 Agent 调用本技能,自动执行 scripts/generate.py,根据提示词和尺寸生成图片并返回本地文件路径
- 简单参数:提示词、尺寸、水印开关
环境配置
- 1. 从对应平台控制台获取 API Key/Token
- 在终端中设置环境变量:
bash
export ZHIPUAPIKEY=你的 API Key
或在工具配置中以同名变量注入。
模型与尺寸
在脚本中通过 --model 选择模型:
- - cogview:对应 cogview-3-flash(默认)
- glm:对应 glm-image
各模型推荐尺寸与限制:
- - glm-image 推荐枚举值:1280x1280(默认), 1568x1056, 1056x1568, 1472x1088, 1088x1472, 1728x960, 960x1728
自定义尺寸: 长宽推荐在 1024px-2048px 范围内, 最大像素数不超过 2^22,长宽需为 32 的整数倍。
- - 其它模型(如 cogview-3-flash)推荐枚举值:1024x1024(默认), 768x1344, 864x1152, 1344x768, 1152x864, 1440x720, 720x1440
自定义尺寸: 长宽需在 512px-2048px 范围内, 最大像素数不超过 2^21,长宽需为 16 的整数倍。
使用方法
命令行生成图片
bash
python scripts/generate.py \
两只可爱的小猫咪,坐在阳光明媚的窗台上,背景是蓝天白云。 \
--model cogview \
--size 1024x1024 \
--no-watermark \
--output cats.png
参数说明
- - prompt:必填,中文或英文提示词
- --model:模型选择,cogview(默认)/glm
- --size:图片尺寸,不传则使用所选模型默认尺寸
- --watermark:开启水印(默认开启)
- --no-watermark:关闭水印
- --output / -o:指定输出文件名,默认自动生成
API 行为说明
json
{
created: 1773146620,
data: [
{ url: https://.../image.png }
],
id: 20260310204340ad2bd838dcb64c7f,
request_id: 20260310204340ad2bd838dcb64c7f
}
- - 本技能会自动解析 data[0].url,下载图片并保存到本地。
在飞书中的使用(给 Agent 的操作指引)
当用户在飞书对话中请求你生成图片时,请按下面步骤操作:
- 1. 使用系统运行工具,在 {baseDir} 目录下执行命令,根据用户的提示词和期望尺寸构造参数,例如:
- python {baseDir}/scripts/generate.py <用户提示词> --model cogview --size <宽x高> --no-watermark --output /root/.openclaw/workspace/images/cogview-{时间戳}.png
- 2. 从脚本标准输出中找到形如 ✅ 图片已保存: /path/to/image.png 的一行,并解析出其中的本地图片路径。
- 使用飞书的发送图片能力,将该图片文件直接作为图片消息发送到当前会话,而不是只把本地路径文本返回给用户。
- 在文字回复中简单说明图片信息(模型、尺寸、提示词等),同时附上生成的图片。
示例
bash
使用 cogview-3-flash,默认尺寸
python scripts/generate.py 一幅赛博朋克城市夜景,霓虹灯与雨夜 -o cyberpunk.png
使用 glm-image,自定义尺寸 + 关闭水印
python scripts/generate.py \
可爱风格的猫咪插画 \
--model glm \
--size 1280x1280 \
--no-watermark