Gemini Image Remix
A versatile tool for text-to-image generation and complex image-to-image remixing. By default, it uses Gemini 2.5 Flash Image for fast, high-quality results. It also supports flagship models like Gemini 3.0 Pro (Nano Banana Pro) for advanced artistic tasks.
Generate Image
Create stunning visuals from a text prompt.
CODEBLOCK0
Remix/Modify Image
Use one or more reference images to guide the generation. Perfect for style transfers, background changes, or character modifications.
CODEBLOCK1
Multi-image Composition
Combine elements from up to 14 different images into a single cohesive scene.
CODEBLOCK2
Advanced Model Selection
Switch to advanced models like Nano Banana Pro for high-fidelity work.
CODEBLOCK3
Options
- -
--prompt, -p: Image description or specific edit instructions. - INLINECODE2 ,
-f: The output path for the generated PNG. - INLINECODE4 ,
-i: Path to an input image (repeatable up to 14 times). - INLINECODE6 ,
-r: 1K (default), 2K, or 4K. - INLINECODE11 ,
-a: Output aspect ratio (e.g., 1:1, 16:9, 9:16, 4:3, 3:4). - INLINECODE18 ,
-m: Model to use (defaults to gemini-2.5-flash-image). Supported: gemini-2.5-flash-image, gemini-3-pro-image-preview. - INLINECODE23 ,
-k: Gemini API key (defaults to GEMINI_API_KEY env var).
Gemini 图像重混
一个用于文本到图像生成和复杂图像到图像重混的多功能工具。默认使用 Gemini 2.5 Flash Image 实现快速、高质量的结果。它还支持旗舰模型,如 Gemini 3.0 Pro (Nano Banana Pro),用于高级艺术任务。
生成图像
根据文本提示创建令人惊叹的视觉效果。
bash
uv run {baseDir}/scripts/remix.py --prompt 霓虹森林中的赛博猫头鹰 --filename owl.png
重混/修改图像
使用一张或多张参考图像来指导生成。非常适合风格迁移、背景更改或角色修改。
bash
uv run {baseDir}/scripts/remix.py --prompt 将艺术风格改为铅笔素描 --filename sketch.png -i original.png
多图像合成
将最多14张不同图像中的元素组合成一个连贯的场景。
bash
uv run {baseDir}/scripts/remix.py --prompt 将图像1中的角色放置到图像2的环境中 --filename result.png -i character.png -i env.png
高级模型选择
切换到高级模型,如 Nano Banana Pro,用于高保真度工作。
bash
uv run {baseDir}/scripts/remix.py --model gemini-3-pro-image-preview --prompt 高度细节的龙油画 --filename dragon.png
选项
- - --prompt, -p:图像描述或具体的编辑指令。
- --filename, -f:生成的PNG文件的输出路径。
- --input-image, -i:输入图像的路径(可重复,最多14次)。
- --resolution, -r:1K(默认)、2K 或 4K。
- --aspect-ratio, -a:输出宽高比(例如 1:1、16:9、9:16、4:3、3:4)。
- --model, -m:使用的模型(默认为 gemini-2.5-flash-image)。支持的模型:gemini-2.5-flash-image、gemini-3-pro-image-preview。
- --api-key, -k:Gemini API密钥(默认为 GEMINIAPIKEY 环境变量)。