返回顶部
a

ali-minimax-toolkitMiniMax多模态工具

MiniMax multimodal generation via API. Use when user wants voice, music, image, image-to-image, or video generation with MiniMax. Supports TTS, music, image (t2i + i2i), and video (t2v, i2v, sef, ref). Cross-platform Python scripts.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
102
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ali-minimax-toolkit

MiniMax 多模态工具包

通过 MiniMax API 生成语音、音乐、图像和视频内容。纯 Python — 在 Windows、Mac 和 Linux 上运行,无需任何第三方依赖。

前置条件

  • - MINIMAXAPIKEY 环境变量(以 sk- 开头)
  • MINIMAXAPIHOST 环境变量(可选,默认值:https://api.minimaxi.com)
  • Python 3.6+
  • 视频时长检测:ffprobe(可选)

快速开始

bash

加载 Python 模块


import sys; sys.path.insert(0, {skillDir}/scripts); import minimax_api

或直接使用命令行:
bash
python {skillDir}/scripts/minimax_api.py tts Hello world -o minimax-output/hello.mp3
python {skillDir}/scripts/minimax_api.py image A cute cat -o minimax-output/cat.png

输出规范

所有生成的文件必须保存到智能体工作目录下的 minimax-output/ 文件夹中。

文本转语音(TTS)

接口:POST /v1/t2a_v2 — 返回十六进制音频,解码后保存为文件。

模型: speech-2.8-hd(推荐,最佳质量)、speech-2.8-turbo(更快)、speech-02-hd、speech-02-turbo

python

基础 TTS


minimaxapi.generatetts(Hello world, output=minimax-output/hello.mp3)

中文特定音色

minimaxapi.generatetts(红叶最多情,一舞寄相思, voice_id=female-shaonv, output=minimax-output/greeting.mp3)

带情感

minimaxapi.generatetts(Im so happy today!, voice_id=male-qn-qingse, emotion=happy, output=minimax-output/happy.mp3)

常用音色 ID: female-shaonv、male-qn-qingse、male-qn-jingying、presentermale、presenterfemale
情感: happy、sad、angry、fearful、disgusted、surprised、calm、fluent、whisper(空值=自动)

音乐生成

接口:POST /v1/music_generation — 需要歌词,返回音频 URL。耗时 30-300 秒。

python

纯音乐(背景音乐)


minimaxapi.generatemusic(soft piano, ambient, peaceful, instrumental=True, output=minimax-output/bgm.mp3)

带歌词的歌曲

minimaxapi.generatemusic( indie folk, melancholic, lyrics=[verse]\nWalking alone\n[chorus]\nFeeling free, output=minimax-output/song.mp3 )

图像生成(文本转图像)

接口:POST /v1/image_generation — 返回图像 URL(即时返回)。

python

基础


minimaxapi.generateimage(A cute cat on a windowsill, photorealistic, output=minimax-output/cat.png)

带宽高比

minimaxapi.generateimage(Mountain landscape, golden hour, aspect_ratio=16:9, output=minimax-output/landscape.png)

多张图像

minimaxapi.generateimage(Abstract geometric art, vibrant, count=3, output=minimax-output/art.png)

带提示词优化器

minimaxapi.generateimage(A man on Venice Beach, 90s documentary, prompt_optimizer=True, output=minimax-output/beach.png)

宽高比: 1:1(默认)、16:9、4:3、3:2、2:3、3:4、9:16、21:9

图像到图像生成

接口:POST /v1/imagegeneration 带 imagefile 参数 — 从参考图像生成新图像。

python

从本地文件


minimaxapi.imageto_image(A girl in a library, minimax-output/face.jpg, output=minimax-output/library.png)

从 URL

minimaxapi.imageto_image(Oil painting style, https://example.com/photo.jpg, output=minimax-output/painting.png)

视频生成

接口:POST /v1/videogeneration(异步)+ GET /v1/query/videogeneration — 需要轮询。

python

文本转视频


minimaxapi.generatevideo(
A golden retriever puppy runs toward camera, tracking shot, golden hour,
output=minimax-output/puppy.mp4
)

图像转视频(提示词仅关注运动)

minimaxapi.generatevideo( Petals sway in breeze, soft light shifts, mode=i2v, first_frame=minimax-output/flower.png, output=minimax-output/flower_video.mp4 )

主体参考(面部一致性)

minimaxapi.generatevideo( A woman walks through a garden, tracking shot, mode=ref, subject_image=minimax-output/face.jpg, output=minimax-output/garden.mp4 )

模型: MiniMax-Hailuo-2.3(默认)、MiniMax-Hailuo-2.3-Fast(i2v)、MiniMax-Hailuo-02(1080P,10秒)
模式: t2v、i2v、sef(起始-结束帧)、ref(主体参考)

视频提示词技巧

主体 + 场景 + 运动 + 镜头运动 + 美学。对于 i2v:仅描述运动,不要重复图像中已有的内容。

生成并发送到飞书

使用 generateandsend.py 生成内容并通过 feishu-media 技能准备飞书投递:

bash

生成 TTS 并发送


python {skillDir}/scripts/generateandsend.py tts Hello --voice female-shaonv --feishu-chat

生成图像并发送

python {skillDir}/scripts/generateandsend.py image A sunset --ratio 16:9 --feishu-chat

设置 FEISHUCHATID 环境变量以避免每次传递 --feishu-chat

export FEISHUCHATID=oc_xxxxx

生成后,脚本输出文件路径和飞书媒体发送指令。使用 feishu-media 技能实际投递内容。

旧版 PowerShell 脚本

原始 scripts/minimax-api.ps1 保留用于向后兼容,但已弃用。请改用 Python 脚本。

错误处理

错误码含义解决方案
2061套餐不支持该模型TTS 尝试使用 speech-02-turbo
1008
余额不足 | 为 MiniMax 账户充值 | | 2013 | 参数无效 | 检查必填字段 |

参考资料

详见 references/ 文件夹中的详细 API 文档、音色目录和提示词指南。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ali-minimax-toolkit-1775942374 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ali-minimax-toolkit-1775942374 技能

通过命令行安装

skillhub install ali-minimax-toolkit-1775942374

下载

⬇ 下载 ali-minimax-toolkit v1.0.0(免费)

文件大小: 28.21 KB | 发布时间: 2026-4-12 08:51

v1.0.0 最新 2026-4-12 08:51
- Initial release of ali-minimax-toolkit for MiniMax multimodal generation.
- Supports TTS, music, image (text-to-image & image-to-image), and video (text/image-to-video, subject/sequence reference) generation via MiniMax APIs.
- Pure Python implementation: cross-platform, no third-party dependencies required.
- Provides both Python module and CLI usage; all outputs saved to minimax-output/ directory.
- Includes quick-start guides, error handling info, API references, and Feishu integration instructions.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部