Tired of getting mediocre AI images? This skill solves the problem: you describe what you want in plain language, and pic-gen (1) picks the best model for your scene, and (2) rewrites your description into professional-grade prompts that actually produce stunning results. Supports Qwen Wanxiang, Banana/Flux, DALL-E 3 — or just the prompt output if you prefer your own pipeline. Trigger: "draw a...", "generate image of...", "optimize this prompt", "AI art".
pic-gen 的核心理念:像和产品经理对话一样,一步一步引导用户完成图片生成,而不是堆参数。
IDLE
│
├─ 用户描述图片需求 ──────────────────────────→ ASK_MODEL
│
ASK_MODEL
│
├─ 用户说「通义」/「qwen」 ─→ 读取 config,默认用 qwen ─→ CONFIRM_PROMPT
├─ 用户说「banana」/「flux」 ─→ 用 banana ─→ CONFIRM_PROMPT
├─ 用户说「dalle」 ─→ 用 dalle ─→ CONFIRM_PROMPT
├─ 用户说「直接生成」 ─→ 用 config 默认模型 ─→ CONFIRM_PROMPT
│
CONFIRM_PROMPT
│
├─ 用户说「可以/好/生成」 ─→ OPTIMIZE → GENERATE
├─ 用户说「改一下 XXX」 ─→ 修改提示词 ─→ CONFIRM_PROMPT
│
GENERATE
│
├─ 图片生成成功 ─→ 返回图片 + 操作选项 ─→ IDLE
└─ 生成失败 ─→ 错误原因 + 重试选项 ─→ GENERATE
用户:「画一只猫」
↓
Bot:「好的!想用什么模型生成?」
「1. 通义万相(默认)2. Banana (Flux) 3. DALL-E」
↓
用户:「1」
↓
Bot 检测到 config 里没有 API key,询问用户:
「请提供你的 DashScope API Key」
同时告知用户也可以手动配置:
「💡 也可以手动配置:编辑 pic-gen/config/models.yaml,填入 api_key 字段。
⚠️ 注意:不要把包含真实 Key 的配置文件分享给他人。」
↓
用户:「sk-xxxxxxxx」
↓
Bot 写入 config/models.yaml,并回复:
「✅ Key 已保存!正在生成…」
↓
Bot 优化提示词 → 生成图片 → 返回
用户可以说:
Bot 自动修改 config/models.yaml,无需重启。
用户也可以一句话搞定所有参数:
Bot:「为你优化后的提示词如下:」
📝 通义万相版:「一片向日葵花田,梵高后印象派风格,浓烈的黄色和蓝色对比,笔触感,星空下的夜晚」
🎨 Midjourney 版:「a sunflower field, post-impressionist style Van Gogh, vivid yellow and blue contrast, brushstroke texture, starry night, --ar 16:9 --s 400」
⚡ Stable Diffusion 版:「masterpiece, best quality, sunflower field, Van Gogh style, post-impressionist, vivid colors, starry night background, oil painting」
[✅ 生成] [✏️ 修改提示词] [⚙️ 调整参数]
pic-gen/
├── SKILL.md ← 本文件
├── config/
│ └── models.yaml ← 模型配置文件(用户 API Key 在此)
├── scripts/
│ ├── optimize.py ← 核心:提示词优化
│ ├── generate_qwen.py ← 通义万相生成器
│ ├── generate_banana.py ← Banana/Flux 生成器
│ └── generate_dalle.py ← DALL-E 生成器
└── references/
├── midjourney.md ← MJ 格式参考
├── stable-diffusion.md ← SD 格式参考
├── flux.md ← Flux 格式参考
└── dalle.md ← DALL-E 格式参考
输入:用户简单描述(中文或英文)
输出:各平台优化后的提示词
| 维度 | 说明 | 示例 |
|---|---|---|
| 主体 | 具体物种/颜色/动作/表情 | 「猫」→「橘猫,坐姿,眯眼打盹」 |
| 场景 |
python
API Key = 你的账号密码,禁止泄露或分享。
yaml
bash
pic-gen/config/models.yaml
用户可通过以下任一方式配置:
| 方式 | 说明 |
|---|---|
| 对话提供 | 直接发送 Key 给 Bot,Bot 自动写入配置文件 |
| 手动编辑 |
yaml
default: qwen
models:
qwen:
enabled: true
api_key: # 填写你的 DashScope API Key
model: qwen-image-2.0-pro
default_size: 1024*1024
default_style: auto
banana:
enabled: false
api_key: # 填写你的 Banana API Key
model: flux-dev
default_size: 1024*1024
dalle:
enabled: false
api_key: # 填写你的 OpenAI API Key
model: dall-e-3
default_size: 1024*1024
| 用户说 | Bot 操作 |
|---|---|
| 「设置通义 key 为 xxx」 | 写入 models.qwen.api_key |
| 「开启 banana」 |
bash
python3 scripts/optimize.py --input 一只猫 --platform qwen
把简单描述转化为各平台最优提示词。
bash
python3 scripts/generate_qwen.py \
--prompt 优化后的提示词 \
--size 1024*1024 \
--count 1 \
--download \
--output ./output
需要 DASHSCOPEAPIKEY 环境变量或 config 中的 api_key。
bash
python3 scripts/generate_banana.py \
--prompt optimized prompt \
--model flux-dev \
--download \
--output ./output
需要 BANANAAPIKEY 环境变量。
bash
python3 scripts/generate_dalle.py \
--prom
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 pic-gen-1776006003 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 pic-gen-1776006003 技能
skillhub install pic-gen-1776006003
文件大小: 27.04 KB | 发布时间: 2026-4-13 11:28