MOSS-TTS 语音合成

⚠️ 注意：本工具负责生成音频文件，发送到各渠道需要配合其他工具（如 OpenClaw message 工具）

快速开始（3 步）

1. 获取 API Key

访问 https://studio.mosi.cn → 注册/登录 → 控制台 → API 密钥 → 创建

CODEBLOCK0

2. 安装依赖

CODEBLOCK1

3. 生成语音

CODEBLOCK2

输出：

{
  "success": true,
  "file": "/tmp/openclaw/moss-tts/voice-xxx.ogg",
  "format": "ogg"
}

⚠️ 隐私与安全

API Key 安全

- 不要提交到 Git：将 MOSS_API_KEY 添加到 INLINECODE1
使用环境变量：不要在代码中硬编码密钥
定期轮换：建议定期更换 API Key

语音数据上传

- 克隆音色：上传的音频会存储在 MOSS Studio 服务器
实时克隆：每次请求都会上传音频数据到 MOSS API
数据保留：参考 MOSS Studio 隐私政策

建议：

- 使用公开/非敏感音频进行克隆
避免上传包含敏感信息的录音
定期清理 MOSS Studio 中不需要的音色

功能说明

本工具提供以下功能：

1. 文本转语音 - 将文本转换为自然语音
实时克隆 - 从音频即时克隆声音
预注册音色 - 上传并保存音色供后续使用
格式转换 - 自动转换为适合各渠道的格式

不包含：

- 直接发送到 IM 渠道（需要配合其他工具）
音色管理（删除、修改等）

使用模式

模式一：实时克隆

CODEBLOCK4

模式二：预注册音色（推荐）

CODEBLOCK5

输出格式

渠道	格式	说明
feishu	ogg (opus)	飞书语音消息格式
telegram

参数说明

参数	说明	必填
INLINECODE2	待合成文本	✅
INLINECODE3

音频要求

- 格式: ogg, mp3, wav, m4a
时长: 10-30 秒（推荐 20 秒以上）
音质: 清晰人声，无背景噪音
大小: < 10MB

常见问题

Q: 如何发送生成的语音？

本工具只生成音频文件。发送需要：

1. 使用返回的文件路径
配合 OpenClaw message 工具或其他方式发送

Q: 飞书发送后是文件而不是语音？

确保音频格式正确：
CODEBLOCK6

Q: 克隆效果不好？

- 时长 20 秒以上
清晰人声，无噪音
正常语速

API 端点

用途	端点
文本转语音	INLINECODE9
上传文件

详细文档

版本: 1.2.0 | 更新: 2026-03-10

MOSS-TTS 语音合成

⚠️ 注意：本工具负责生成音频文件，发送到各渠道需要配合其他工具（如 OpenClaw message 工具）

快速开始（3 步）

1. 获取 API Key

访问 https://studio.mosi.cn → 注册/登录 → 控制台 → API 密钥 → 创建

bash
export MOSSAPIKEY=sk-你的密钥

2. 安装依赖

bash

系统依赖

brew install python3 ffmpeg

Python 依赖

pip3 install requests

3. 生成语音

bash
python3 scripts/tts.py \
--text 你好，我是MOSS \
--channel feishu \
--json

输出：
json
{
success: true,
file: /tmp/openclaw/moss-tts/voice-xxx.ogg,
format: ogg
}

⚠️ 隐私与安全

API Key 安全

- 不要提交到 Git：将 MOSSAPIKEY 添加到 .gitignore
使用环境变量：不要在代码中硬编码密钥
定期轮换：建议定期更换 API Key

语音数据上传

- 克隆音色：上传的音频会存储在 MOSS Studio 服务器
实时克隆：每次请求都会上传音频数据到 MOSS API
数据保留：参考 MOSS Studio 隐私政策

建议：

- 使用公开/非敏感音频进行克隆
避免上传包含敏感信息的录音
定期清理 MOSS Studio 中不需要的音色

功能说明

本工具提供以下功能：

1. 文本转语音 - 将文本转换为自然语音
实时克隆 - 从音频即时克隆声音
预注册音色 - 上传并保存音色供后续使用
格式转换 - 自动转换为适合各渠道的格式

不包含：

- 直接发送到 IM 渠道（需要配合其他工具）
音色管理（删除、修改等）

使用模式

模式一：实时克隆

bash
python3 scripts/tts.py \
--text 要说的内容 \
--reference_audio 参考音频.ogg \
--channel feishu

模式二：预注册音色（推荐）

bash

1. 上传并克隆

curl -X POST https://studio.mosi.cn/api/v1/files/upload \
-H Authorization: Bearer $MOSSAPIKEY \
-F file=@voice.ogg

→ {fileid: YOURFILE_ID}

curl -X POST https://studio.mosi.cn/api/v1/voice/clone \
-H Authorization: Bearer $MOSSAPIKEY \
-d {fileid: YOURFILE_ID, name: 我的声音}

→ {voiceid: YOURVOICE_ID}

2. 使用（等待 10 秒后）

python3 scripts/tts.py \ --text 你好 \ --voiceid YOURVOICE_ID \ --channel feishu

输出格式

渠道	格式	说明
feishu	ogg (opus)	飞书语音消息格式
telegram

参数说明

参数	说明	必填
--text	待合成文本	✅
--reference_audio

音频要求

- 格式: ogg, mp3, wav, m4a
时长: 10-30 秒（推荐 20 秒以上）
音质: 清晰人声，无背景噪音
大小: < 10MB

常见问题

Q: 如何发送生成的语音？

本工具只生成音频文件。发送需要：

1. 使用返回的文件路径
配合 OpenClaw message 工具或其他方式发送

Q: 飞书发送后是文件而不是语音？

确保音频格式正确：
bash
file voice.ogg

应显示: Ogg data, Opus audio

Q: 克隆效果不好？

- 时长 20 秒以上
清晰人声，无噪音
正常语速

API 端点

用途	端点
文本转语音	POST /v1/audio/tts
上传文件

详细文档

版本: 1.2.0 | 更新: 2026-03-10

moss-tts-voice苔藓语音合成

moss-tts-voice

MOSS-TTS 语音合成

快速开始（3 步）

1. 获取 API Key

2. 安装依赖

3. 生成语音

⚠️ 隐私与安全

API Key 安全

语音数据上传

功能说明

使用模式

模式一：实时克隆

模式二：预注册音色（推荐）

输出格式

参数说明

音频要求

常见问题

Q: 如何发送生成的语音？

Q: 飞书发送后是文件而不是语音？

Q: 克隆效果不好？

API 端点

详细文档

MOSS-TTS 语音合成

快速开始（3 步）

1. 获取 API Key

2. 安装依赖

系统依赖

Python 依赖

3. 生成语音

⚠️ 隐私与安全

API Key 安全

语音数据上传

功能说明

使用模式

模式一：实时克隆

模式二：预注册音色（推荐）

1. 上传并克隆

→ {fileid: YOURFILE_ID}

→ {voiceid: YOURVOICE_ID}

2. 使用（等待 10 秒后）

输出格式

参数说明

音频要求

常见问题

Q: 如何发送生成的语音？

Q: 飞书发送后是文件而不是语音？

应显示: Ogg data, Opus audio

Q: 克隆效果不好？

API 端点

详细文档

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement