返回顶部
m

moss-tts-voice苔藓语音合成

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.2.2
安全检测
已通过
926
下载量
免费
免费
7
收藏
概述
安装方式
版本历史

moss-tts-voice

MOSS-TTS 语音合成

⚠️ 注意:本工具负责生成音频文件,发送到各渠道需要配合其他工具(如 OpenClaw message 工具)

快速开始(3 步)

1. 获取 API Key

访问 https://studio.mosi.cn → 注册/登录 → 控制台 → API 密钥 → 创建

bash
export MOSSAPIKEY=sk-你的密钥

2. 安装依赖

bash

系统依赖


brew install python3 ffmpeg

Python 依赖

pip3 install requests

3. 生成语音

bash
python3 scripts/tts.py \
--text 你好,我是MOSS \
--channel feishu \
--json

输出:
json
{
success: true,
file: /tmp/openclaw/moss-tts/voice-xxx.ogg,
format: ogg
}



⚠️ 隐私与安全

API Key 安全

  • - 不要提交到 Git:将 MOSSAPIKEY 添加到 .gitignore
  • 使用环境变量:不要在代码中硬编码密钥
  • 定期轮换:建议定期更换 API Key

语音数据上传

  • - 克隆音色:上传的音频会存储在 MOSS Studio 服务器
  • 实时克隆:每次请求都会上传音频数据到 MOSS API
  • 数据保留:参考 MOSS Studio 隐私政策

建议

  • - 使用公开/非敏感音频进行克隆
  • 避免上传包含敏感信息的录音
  • 定期清理 MOSS Studio 中不需要的音色



功能说明

本工具提供以下功能:

  1. 1. 文本转语音 - 将文本转换为自然语音
  2. 实时克隆 - 从音频即时克隆声音
  3. 预注册音色 - 上传并保存音色供后续使用
  4. 格式转换 - 自动转换为适合各渠道的格式

不包含

  • - 直接发送到 IM 渠道(需要配合其他工具)
  • 音色管理(删除、修改等)



使用模式

模式一:实时克隆

bash
python3 scripts/tts.py \
--text 要说的内容 \
--reference_audio 参考音频.ogg \
--channel feishu

模式二:预注册音色(推荐)

bash

1. 上传并克隆


curl -X POST https://studio.mosi.cn/api/v1/files/upload \
-H Authorization: Bearer $MOSSAPIKEY \
-F file=@voice.ogg

→ {fileid: YOURFILE_ID}

curl -X POST https://studio.mosi.cn/api/v1/voice/clone \
-H Authorization: Bearer $MOSSAPIKEY \
-d {fileid: YOURFILE_ID, name: 我的声音}

→ {voiceid: YOURVOICE_ID}

2. 使用(等待 10 秒后)

python3 scripts/tts.py \ --text 你好 \ --voiceid YOURVOICE_ID \ --channel feishu

输出格式

渠道格式说明
feishuogg (opus)飞书语音消息格式
telegram
ogg (opus) | Telegram 语音消息格式 | | whatsapp | ogg (opus) | WhatsApp 语音消息格式 | | discord | mp3 | Discord 文件格式 | | signal | mp3 | Signal 文件格式 | | slack | mp3 | Slack 文件格式 |

参数说明

参数说明必填
--text待合成文本
--reference_audio
参考音频(实时克隆) | 二选一 | | --voice_id | 预注册音色 ID | 二选一 | | --channel | 目标渠道 | ❌ | | --format | 输出格式 | ❌ | | --output | 输出路径 | ❌ | | --json | JSON 输出 | ❌ |

音频要求

  • - 格式: ogg, mp3, wav, m4a
  • 时长: 10-30 秒(推荐 20 秒以上)
  • 音质: 清晰人声,无背景噪音
  • 大小: < 10MB

常见问题

Q: 如何发送生成的语音?

本工具只生成音频文件。发送需要:

  1. 1. 使用返回的文件路径
  2. 配合 OpenClaw message 工具或其他方式发送

Q: 飞书发送后是文件而不是语音?

确保音频格式正确:
bash
file voice.ogg

应显示: Ogg data, Opus audio

Q: 克隆效果不好?

  • - 时长 20 秒以上
  • 清晰人声,无噪音
  • 正常语速

API 端点

用途端点
文本转语音POST /v1/audio/tts
上传文件
POST /api/v1/files/upload | | 克隆音色 | POST /api/v1/voice/clone | | 查询音色 | GET /api/v1/voices |

详细文档


版本: 1.2.0 | 更新: 2026-03-10

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 moss-tts-voice-1776277703 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 moss-tts-voice-1776277703 技能

通过命令行安装

skillhub install moss-tts-voice-1776277703

下载

⬇ 下载 moss-tts-voice v1.2.2(免费)

文件大小: 12.99 KB | 发布时间: 2026-4-16 17:39

v1.2.2 最新 2026-4-16 17:39
fix some bug in tts.py

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部