返回顶部
m

minimax-tokenplan-tts极小极大语音合成

>-

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
130
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

minimax-tokenplan-tts

MiniMax TTS 技能

前置条件

  • - Python 3 已安装
  • requests 库:pip3 install requests
  • websockets 库:pip3 install websockets(流式播放需要)
  • ffplay(流式播放需要):
- macOS: brew install ffmpeg - Ubuntu: sudo apt install ffmpeg - Windows: 从 https://ffmpeg.org/download.html 下载 - 如果 ffplay 未安装,stream_play.py 会提示安装方法

init

需要初始化以下信息:

第一步:获取 API Key

向用户获取 MiniMax API Key(sk-cp- 开头的 Token Plan key,或普通 API Key)。

第二步:确认配置

向用户确认:

  • - API Key 是否正确
  • 使用国内(https://api.minimaxi.com)还是海外(https://api.minimaxi.io)节点

第三步:填写配置

获取以上信息后:

  1. 1. 修改 scripts/generate.py 顶部的配置常量(APIKEY、BASEURL),填入实际值
  2. 修改 scripts/streamplay.py 顶部的配置常量(APIKEY、BASE_URL),填入相同的值
  3. 同时更新下方 ## 配置 区段的表格,作为配置记录

第四步:判断音色

  1. 1. 根据 IDENTITY.md 自行选择声优
  2. 如判断不出,则使用 male-qn-jingying(精英青年音色)
  3. 然后更新下方 ## 配置 区段的表格及两个脚本

第五步:清理

配置填写完成后,删除本 ## init 区段(包括 ### 需要初始化以下信息 的全部内容),仅保留 ## 配置 区段



配置


配置项说明
MINIMAXAPIKEY<待填入>初始化时替换为实际 key
BASE_URL
<待填入> | CN: https://api.minimaxi.com / Global: https://api.minimaxi.io |
| REGION | <待填入> | CN 或 global |
| VOICE_ID | <待填入> | 判断音色后填入 |


音色列表

语言因音色较多,不再逐一列出,完整列表参考 MiniMax TTS 官方文档



快速使用

📢 channel=webchat 时的播放策略:当前 channel 为 webchat(实时对话场景)时,
应优先使用 stream_play.py 直接流式播放,而不生成文件。这样用户可以立即听到语音,
无需等待完整音频生成。仅当用户明确要求保存文件时,才使用 generate.py。

1️⃣ 流式播放(channel=webchat)

通过 WebSocket 实时获取音频流,边生成边用 ffplay 播放。无需生成文件,首个音频包到达即开始播放

bash
SKILL_DIR=~/.openclaw/workspace/skills/minimax-tokenplan-tts
python3 $SKILLDIR/scripts/streamplay.py \
--text 要播放的文本内容 \
--voice male-qn-jingying

注意:以下示例中 stream_play.py 和 generate.py 均指 ~/.openclaw/workspace/skills/minimax-tokenplan-tts/scripts/ 下的完整路径。

参数说明:

参数必填说明默认值
--text要播放的文本,最长 10000 字符-
--voice
❌ | 声优 ID | male-qn-jingying |
| --speed | ❌ | 语速 [0.5,2.0] | 1.0 |
| --vol | ❌ | 音量 (0,10] | 1.0 |
| --pitch | ❌ | 音调 [-12,12] | 0 |
| --save | ❌ | 同时保存到文件(MP3 格式) | 不保存 |
| --api-key | ❌ | API Key(默认使用文件顶部配置) | - |
| --base-url | ❌ | Base URL(默认使用文件顶部配置) | - |

示例:

bash

直接播放(不保存文件)


python3 stream_play.py --text 你好,我正在通过流式方式播放语音

播放同时保存到文件

python3 streamplay.py --text 这段语音会被保存 --save /tmp/streamoutput.mp3

使用女声播放

python3 stream_play.py --text 今天天气真不错 --voice female-tianmei

2️⃣ 文件生成(需要保存 WAV 时使用)

bash
SKILL_DIR=~/.openclaw/workspace/skills/minimax-tokenplan-tts
python3 $SKILL_DIR/scripts/generate.py \
--text 要转换的文本内容 \
--voice male-qn-jingying \
--output /tmp/tts_output.wav

参数说明:

参数必填说明默认值
--text要转换的文本,最长 10000 字符,超出会报错-
--voice
❌ | 声优 ID | male-qn-jingying |
| --speed | ❌ | 语速 [0.5,2.0] | 1.0 |
| --vol | ❌ | 音量 (0,10] | 1.0 |
| --pitch | ❌ | 音调 [-12,12] | 0 |
| --output | ❌ | 输出路径 | 自动生成 |
| --api-key | ❌ | API Key(默认使用文件顶部配置) | - |
| --base-url | ❌ | Base URL(默认使用文件顶部配置) | - |

声优可选值: 完整327个音色列表见 ## 音色列表

示例:

bash

基本用法


python3 generate.py --text 你好,欢迎使用 MiniMax TTS --output /tmp/hello.wav

快速播报(1.5倍速)

python3 generate.py --text 紧急通知,请立即处理 --speed 1.5 --output /tmp/alert.wav

柔和女声

python3 generate.py --text 今天天气真不错 --voice female-qn-tianying --output /tmp/weather.wav

工作流总结

TTS 完整流程

  1. 1. 文本预处理 → 检查是否需要插入语气词标签(见 ## 语气词标签)
  2. 选择声优 → --voice 参数(默认 male-qn-jingying)
  3. 调整参数 → --speed / --vol / --pitch
  4. 生成 WAV → 脚本调用 MiniMax TTS API(自动处理 HEX 解码)
  5. 格式转换 → 如需 MP3/AAC 等格式,用 ffmpeg 转换

脚本输出格式

generate.py

调用 generate.py 后,stdout 输出生成结果,格式如下:

stdout 输出说明
保存后的文件绝对路径~/.openclaw/media/minimax/tts/tts-2026-03-27-hello.wav

stream_play.py

调用 stream_play.py 后,stdout 输出播放状态:

stdout 输出说明
STREAMPLAYDONE流式播放完成
STREAMPLAYERROR: <msg>
播放失败,附带错误信息 |

两个脚本的日志信息([INFO]、[WARN]、[ERROR])均输出到 stderr,不会混入 stdout。


错误处理

code含义处理
0成功继续
1002
限流 | 提醒用户 API 限流中,建议稍后重试 | | 1004 | 鉴权失败 | 检查

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 minimax-tokenplan-tts-1775964971 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 minimax-tokenplan-tts-1775964971 技能

通过命令行安装

skillhub install minimax-tokenplan-tts-1775964971

下载

⬇ 下载 minimax-tokenplan-tts v1.0.1(免费)

文件大小: 15 KB | 发布时间: 2026-4-13 11:03

v1.0.1 最新 2026-4-13 11:03
- Updated skill version to 1.0.1.
- Refined the initialization instructions for API Key and BASE_URL: users now need to manually fill both generate.py and stream_play.py, rather than loading from multiple config locations.
- Clarified the requirement to confirm network region and voice selection during setup.
- No functional code or API changes; only documentation updated for clearer setup steps.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部