返回顶部
I

IMA StudioIMA工作室

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.10
安全检测
已通过
1,639
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

IMA Studio

IMA AI 创作

⚠️ 重要:模型 ID 参考

关键提示: 调用脚本时,必须使用精确的 modelid(第二列),而不是友好的模型名称。请勿从友好名称推断 modelid(例如,❌ nano-banana-pro 是错误的;✅ gemini-3-pro-image 是正确的)。

快速参考表:

图像模型

友好名称model_id说明
Nano Banana2gemini-3.1-flash-image❌ 不是 nano-banana-2,预算选择 4-13 积分
Nano Banana Pro
gemini-3-pro-image | ❌ 不是 nano-banana-pro,高质量 10-18 积分 | | SeeDream 4.5 | doubao-seedream-4.5 | ✅ 推荐默认,5 积分 | | Midjourney | midjourney | ✅ 与友好名称相同,8-10 积分 |

视频模型

友好名称modelid (文生视频)modelid (图生视频)说明
Wan 2.6wan2.6-t2vwan2.6-i2v⚠️ 注意 -t2v/-i2v 后缀
IMA Video Pro (Sevio 1.0)
ima-pro | ima-pro | ✅ IMA 原生质量模型 | | IMA Video Pro Fast (Sevio 1.0-Fast) | ima-pro-fast | ima-pro-fast | ✅ IMA 原生低延迟模型 | | Kling O1 | kling-video-o1 | kling-video-o1 | ⚠️ 注意 video- 前缀 | | Kling 2.6 | kling-v2-6 | kling-v2-6 | ⚠️ 注意 v 前缀 | | Hailuo 2.3 | MiniMax-Hailuo-2.3 | MiniMax-Hailuo-2.3 | ⚠️ 注意 MiniMax- 前缀 | | Hailuo 2.0 | MiniMax-Hailuo-02 | MiniMax-Hailuo-02 | ⚠️ 注意 02 而不是 2.0 | | Google Veo 3.1 | veo-3.1-generate-preview | veo-3.1-generate-preview | ⚠️ 注意 -generate-preview 后缀 | | Sora 2 Pro | sora-2-pro | sora-2-pro | ✅ 直接明了 | | Pixverse | pixverse | pixverse | ✅ 与友好名称相同 |

音乐模型

友好名称model_id说明
Suno (sonic v4)sonic⚠️ 简化为 sonic
DouBao BGM
GenBGM | ❌ 不是 doubao-bgm | | DouBao Song | GenSong | ❌ 不是 doubao-song |

语音模型

友好名称model_id说明
seed-tts-2.0seed-tts-2.0✅ 与友好名称相同(默认)

如何获取正确的 model_id:

  1. 1. 首先检查此表
  2. 使用 --list-models --task-type <类型> 查询可用模型
  3. 参考此 SKILL.md 中的命令示例

运行时真实数据源:GET /open/v1/product/list(或 --list-models)。
本文档中的任何表格仅供参考;实际可用性取决于当前产品列表。

示例:
bash

❌ 错误:从友好名称推断


--model-id nano-banana-pro

✅ 正确:使用表中的精确 model_id

--model-id gemini-3-pro-image

📚 可选知识增强 (ima-knowledge-ai)

此技能可作为独立包完整运行。
如果安装了 ima-knowledge-ai,代理可以读取其参考资料以进行工作流分解和一致性指导。

推荐的可选阅读:

  1. 1. 检查工作流复杂性 — 如果以下情况,请阅读 ima-knowledge-ai/references/workflow-design.md:
- 用户提及:MV、宣传片、完整作品、配乐、soundtrack - 任务跨越多种媒体类型(图像 + 视频、视频 + 音乐等) - 需要任务分解的复杂多步骤工作流
  1. 2. 检查视觉一致性需求 — 如果以下情况,请阅读 ima-knowledge-ai/references/visual-consistency.md:
- 用户提及:系列、多张、同一个、角色、续、series、same - 任务涉及:多张图像/视频、角色连续性、产品拍摄 - 关于同一主题的第二次及以上请求(例如,在生成旺财照片之后要求旺财在游泳)
  1. 3. 检查视频模式 — 如果以下情况,请阅读 ima-knowledge-ai/references/video-modes.md:
- 任何视频生成任务 - 需要理解:图生视频与参考图生视频的区别
  1. 4. 检查模型选择 — 如果以下情况,请阅读 ima-knowledge-ai/references/model-selection.md:
- 不确定使用哪个模型 - 需要成本/质量权衡指导 - 用户指定预算或质量要求

为什么这很重要:

  • - 多媒体工作流需要正确的任务排序(例如,视频时长 → 匹配音乐时长)
  • AI 生成每次默认独立生成 — 没有参考图像,结果将不一致
  • 错误的视频模式 = 错误的结果(图生视频 ≠ 参考图生视频)
  • 模型选择会显著影响成本和质量

多媒体工作流示例:

用户:帮我做个产品宣传MV,有背景音乐,主角是旺财小狗

❌ 错误:
1. 生成狗的图像(随机外观)
2. 生成视频(不同的狗)
3. 生成音乐(不相关)

✅ 正确:
1. 阅读 workflow-design.md + visual-consistency.md
2. 生成主参考:旺财小狗图片
3. 使用图生视频生成视频镜头,以旺财作为第一帧
4. 获取视频时长(例如,15秒)
5. 生成匹配时长和氛围的背景音乐

如何检查:
python

步骤 0:首先确定媒体类型(图像 / 视频 / 音乐 / 语音)


从用户请求:画/生成图/image → 图像;视频/video → 视频;音乐/歌/music/BGM → 音乐;语音/朗读/TTS/speech → 语音


然后从相应部分选择 tasktype 和模型(图像:texttoimage/imagetoimage;视频:texttovideo/...;音乐:texttomusic;语音:textto_speech)

步骤 1:根据任务类型读取知识库

if multimediaworkflow: read(~/.openclaw/skills/ima-knowledge-ai/references/workflow-design.md)

if same subject or series or character:
read(~/.openclaw/skills/ima-knowledge-ai/references/visual-consistency.md)

if video_generation:
read(~/.openclaw/skills/ima-knowledge-ai/references/video-modes.md)

步骤 2:使用正确的排序和参考图像执行

(具体模式请参见 workflow-design.md)

无例外 — 对于简单的单媒体请求,可以直接进行。对于复杂的多媒体工作流,请先阅读知识库。



📥 用户输入解析(媒体类型和任务路由)

目的: 使任何代理都能一致地解析用户意图,首先从用户请求中确定媒体类型,然后选择 task_type 和模型。

1. 用户措辞 → 媒体类型(首先执行此操作)

用户意图 / 关键词媒体类型tasktype 示例
画 / 生成图 / 图片 / image / 画一张 / 图生图图像texttoimage, imagetoimage
视频 / 生成视频 / video / 图生视频 / 文生视频
视频 | texttovideo, imagetovideo, firstlastframetovideo, referenceimagetovideo | | 音乐 / 歌 / BGM / 背景音乐 / music

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ima-all-ai-1776112442 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ima-all-ai-1776112442 技能

通过命令行安装

skillhub install ima-all-ai-1776112442

下载

⬇ 下载 IMA Studio v1.0.10(免费)

文件大小: 56.09 KB | 发布时间: 2026-4-14 09:56

v1.0.10 最新 2026-4-14 09:56
**Expanded model coverage and platform details with better integration notes.**

- Added explicit support for IMA Video Pro (Sevio 1.0), IMA Video Pro Fast (Sevio 1.0-Fast), and clarified support for Sonic v5 music generation.
- Updated platform description to emphasize unified access to all leading models (image, video, music, TTS).
- Improved credential/environment details, including which endpoints use the API key and when.
- Formalized persistence/logging retention and optional integration with ima-knowledge-ai documentation.
- Enhanced clarity in model reference tables and introduced dynamic model availability guidance.
- Minor keyword/description improvements for better discoverability and clarity.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部