Gemini Image Simple
Generate and edit images using Google's Nano Banana Pro (Gemini 3 Pro Image) - the highest quality image generation model.
Why This Skill
| Feature | This Skill | Others (nano-banana-pro, etc.) |
|---|
| Dependencies | None (stdlib only) | google-genai, pillow, etc. |
| Requires pip/uv |
❌ No | ✅ Yes |
|
Works on Fly.io free | ✅ Yes | ❌ Fails |
|
Works in containers | ✅ Yes | ❌ Often fails |
|
Image generation | ✅ Full | ✅ Full |
|
Image editing | ✅ Yes | ✅ Yes |
|
Setup complexity | Just set API key | Install packages first |
Bottom line: This skill works anywhere Python 3 exists. No package managers, no virtual environments, no permission issues.
Quick Start
CODEBLOCK0
Usage
Generate new image
CODEBLOCK1
Edit existing image
CODEBLOCK2
Supported input formats: PNG, JPG, JPEG, GIF, WEBP
Environment
Set GEMINI_API_KEY environment variable. Get one at https://aistudio.google.com/apikey
How It Works
Uses Nano Banana Pro (nano-banana-pro-preview) - Google's highest quality image generation model:
- - Pure
urllib.request for HTTP (no requests library) - Pure
json for parsing (stdlib) - Pure
base64 for encoding (stdlib)
That's it. No external packages. Works on any Python 3.10+ installation.
Model
Currently using: nano-banana-pro-preview (also known as Gemini 3 Pro Image)
Other available models (can be changed in generate.py if needed):
- -
gemini-3-pro-image-preview - Same as Nano Banana Pro - INLINECODE7 - Imagen 4.0 Ultra
- INLINECODE8 - Imagen 4.0
- INLINECODE9 - Gemini 2.5 Flash with image gen
Examples
CODEBLOCK3
Gemini 图像简易版
使用谷歌 Nano Banana Pro(Gemini 3 Pro 图像版)生成和编辑图像——最高质量的图像生成模型。
为何选择此技能
| 特性 | 本技能 | 其他技能(nano-banana-pro 等) |
|---|
| 依赖项 | 无(仅标准库) | google-genai、pillow 等 |
| 需要 pip/uv |
❌ 不需要 | ✅ 需要 |
|
可在 Fly.io 免费版运行 | ✅ 可以 | ❌ 失败 |
|
可在容器中运行 | ✅ 可以 | ❌ 经常失败 |
|
图像生成 | ✅ 完整 | ✅ 完整 |
|
图像编辑 | ✅ 支持 | ✅ 支持 |
|
设置复杂度 | 仅需设置 API 密钥 | 需先安装包 |
总结: 此技能可在任何安装 Python 3 的环境中运行。无需包管理器,无需虚拟环境,无权限问题。
快速开始
bash
生成图像
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py 一只戴着迷你帽子的猫 cat.png
编辑现有图像
python3 /data/clawd/skills/gemini-image-simple/scripts/generate.py 改为日落光线 edited.png --input original.png
使用方法
生成新图像
bash
python3 {baseDir}/scripts/generate.py 你的提示词 output.png
编辑现有图像
bash
python3 {baseDir}/scripts/generate.py 编辑指令 output.png --input source.png
支持的输入格式:PNG、JPG、JPEG、GIF、WEBP
环境配置
设置 GEMINIAPIKEY 环境变量。在 https://aistudio.google.com/apikey 获取密钥。
工作原理
使用 Nano Banana Pro(nano-banana-pro-preview)——谷歌最高质量的图像生成模型:
- - 纯 urllib.request 处理 HTTP(无需 requests 库)
- 纯 json 解析(标准库)
- 纯 base64 编码(标准库)
仅此而已。无外部包。可在任何 Python 3.10+ 安装环境中运行。
模型
当前使用:nano-banana-pro-preview(也称为 Gemini 3 Pro 图像版)
其他可用模型(如有需要可在 generate.py 中更改):
- - gemini-3-pro-image-preview - 与 Nano Banana Pro 相同
- imagen-4.0-ultra-generate-001 - Imagen 4.0 Ultra
- imagen-4.0-generate-001 - Imagen 4.0
- gemini-2.5-flash-image - 支持图像生成的 Gemini 2.5 Flash
示例
bash
风景图
python3 {baseDir}/scripts/generate.py 日出时分的雾蒙山脉,照片级真实感 mountains.png
产品图
python3 {baseDir}/scripts/generate.py 极简风格咖啡杯产品照片,白色背景 coffee.png
编辑:改变风格
python3 {baseDir}/scripts/generate.py 转换为水彩画风格 watercolor.png --input photo.jpg
编辑:添加元素
python3 {baseDir}/scripts/generate.py 在天空中添加一道彩虹 rainbow.png --input landscape.png