返回顶部
h

hidream-model-gen智小象生成

Generate images and videos using Vivago AI (智小象) platform. Supports text-to-image, image-to-image, image-to-video, and keyframe-to-video generation. Use when the user wants to create AI-generated images or videos, transform existing images, or perform image style transfer through the Vivago AI API.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.5
安全检测
已通过
266
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

hidream-model-gen

Vivago AI 技能

与 Vivago AI(智小象)平台集成,实现 AI 驱动的图像和视频生成。

支持的功能

图像生成

  • - 文生图(txt2img):根据文本描述生成图像
  • 图生图(img2img):基于提示词转换现有图像,包括风格迁移、图像编辑和多图像融合

视频生成

  • - 文生视频(txt2vid):根据文本描述生成视频
  • 图生视频(img2vid):从静态图像生成视频
  • 关键帧转视频(keyframetovideo):从起始和结束关键帧生成过渡视频
  • 视频模板(templatetovideo):181 种预定义视频效果
  • 支持多个模型版本(v3Pro、v3L、kling-video-o1)

附加功能

  • - 图像上传至 Vivago 存储
  • 批量生成(最多 4 张图像)
  • 多种宽高比(1:1、4:3、3:4、16:9、9:16)
  • 带轮询的自动重试

架构

核心模块

scripts/
├── vivago_client.py # 主 API 客户端
├── template_manager.py # 模板管理
├── config_loader.py # 配置加载
├── enums.py # 类型枚举(TaskStatus、AspectRatio 等)
├── exceptions.py # 结构化异常
└── config/ # 模块化配置文件

代码质量

  • - 类型安全:完整的类型注解和枚举
  • 异常处理:结构化的异常层级
  • CI/CD:GitHub Actions 自动化测试
  • 模块化配置:拆分配置文件以提高可维护性

设置

前提条件

使用此技能前,您需要获取 Vivago.ai API Token:

步骤 1:登录 Vivago.ai

  1. 1. 访问 https://vivago.ai/ 并登录您的账户
  2. 检查剩余积分,如有需要可订阅合适的套餐

步骤 2:获取您的 Token

  1. 1. 登录后,访问 https://vivago.ai/prod-api/user/token
  2. 页面将返回您的 API Token(JWT 格式)
  3. 复制此 Token 用于配置

安全提示:Token 是您访问 API 的凭证,请妥善保管,不要与他人分享。

环境变量

安全提示: 为确保安全部署和 AI Agent 使用,系统要求 Token 必须通过 HIDREAM_AUTHORIZATION 环境变量传递。

在当前会话中安全地导出:

bash
export HIDREAMAUTHORIZATION=yourvivagoapitoken

注意: STORAGEAK 和 STORAGESK 已弃用并移除。图像上传使用 Vivago API 提供的安全预签名 URL。

文件输出配置

重要提示: 默认情况下,所有生成的资源(JSON 结果、下载的图像和视频)将输出到当前工作目录下的 assets/ 文件夹。请确保该目录存在或系统有权限创建它。

安装

bash
pip install -r requirements.txt

使用方法

Python API

python
from scripts import create_client, VivagoClient
from scripts.enums import AspectRatio, PortName, TaskStatus
from scripts.exceptions import TaskFailedError, TaskTimeoutError

创建客户端

client = create_client()

文生图

results = client.texttoimage( prompt=a beautiful sunset over mountains, port=PortName.KLINGIMAGE, # 或 PortName.NANOBANANA whratio=AspectRatio.RATIO16_9, batch_size=2 )

图生视频(使用本地图像)

results = client.imagetovideo( prompt=camera slowly zooming out, imageuuid=client.uploadimage(/path/to/image.jpg), port=PortName.V3PRO, whratio=AspectRatio.RATIO16_9, duration=5 )

关键帧转视频(使用起始和结束图像)

results = client.keyframetovideo( prompt=smooth transition from start to end, startimageuuid=client.upload_image(/path/to/start.jpg), endimageuuid=client.upload_image(/path/to/end.jpg), port=PortName.V3PRO, whratio=AspectRatio.RATIO16_9, duration=5 )

视频模板 - 使用预定义效果

results = client.templatetovideo( imageuuid=client.uploadimage(/path/to/image.jpg), template=ghibli, # 查看下方可用模板 whratio=AspectRatio.RATIO9_16 )

错误处理

python
from scripts.exceptions import (
TaskFailedError,
TaskRejectedError,
TaskTimeoutError,
InvalidPortError
)

try:
results = client.imagetovideo(...)
except TaskFailedError as e:
print(fTask failed: {e.task_id})
except TaskRejectedError as e:
print(fContent rejected: {e.reason})
except TaskTimeoutError as e:
print(fTimeout after {e.timeout_seconds}s)
except InvalidPortError as e:
print(fInvalid port: {e.port}, available: {e.available})

命令行(最适合 AI Agent)

对于 AI Agent: 使用此技能最简单的方式是通过提供的 CLI 脚本。它们自动处理 API 通信、轮询和结果解析。默认情况下,它们使用 HiDream 的原生模型

文生图:
bash
python3 scripts/txt2img.py \
--prompt a futuristic city \
--wh-ratio 16:9 \
--batch-size 2 \
--output ./assets/results.json

注意:默认使用 hidream-txt2img 模型。

文生视频:
bash
python3 scripts/txt2vid.py \
--prompt a cybernetic dragon flying over a futuristic city \
--wh-ratio 16:9 \
--duration 5 \
--output ./assets/video_results.json

注意:默认使用 v3Pro 模型。

图生视频:
bash
python3 scripts/img2video.py \
--prompt slow motion falling leaves \
--image ./assets/source_image.jpg \
--duration 5 \
--output ./assets/video.json

API 参考

枚举

python
from scripts.enums import (
TaskStatus, # PENDING, COMPLETED, PROCESSING, FAILED, REJECTED
AspectRatio, # RATIO11, RATIO43, RATIO169, 等
PortCategory, # TEXTTOIMAGE, IMAGETOVIDEO, 等
PortName # KLINGIMAGE, V3PRO, NANOBANANA, 等
)

模型

功能可用版本默认
文生图v3L (HiDream), kling-image-o1v3L(通过端口 hidream-txt2img)
图生视频
v3Pro, v3L, kling-video-o1 | v3Pro | | 关键帧转视频 | v3Pro, v3L | v3Pro |

AI Agent 注意: 默认情况下,所有 CLI 工具(txt2img.py、txt2vid.py)已预配置使用 HiDream 的原生模型(图像使用 hidream-txt2img,视频使用 v3Pro)。除非用户明确要求,否则无需指定模型。

宽高比

  • - 1:1 - 正方形
  • 4:3 - 标准
  • 3:4 - 竖屏
  • 16:9 - 宽屏
  • 9:16 - 手机/竖屏

任务状态码

python
from scripts.enums import TaskStatus

TaskStatus.PENDING # 0 - 待处理
TaskStatus.COMPLETED # 1 - 已完成
TaskStatus.PROCESSING # 2 - 处理中
TaskStatus.FAILED # 3 - 失败
TaskStatus.REJECTED # 4 - 被拒绝(内容审核)

文件结构

vivago-ai-skill/
├── scripts/
│ ├── init.py # 包导出
│ ├── vivago_client.py # 核心 API 客户端

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 hidream-model-gen-1776112092 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 hidream-model-gen-1776112092 技能

通过命令行安装

skillhub install hidream-model-gen-1776112092

下载

⬇ 下载 hidream-model-gen v1.0.5(免费)

文件大小: 163.06 KB | 发布时间: 2026-4-17 15:01

v1.0.5 最新 2026-4-17 15:01
Version 1.0.5

- Changed CLI script instructions to use python3 instead of python.
- No other user-facing changes.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部