返回顶部
b

byted-text-to-speech文本转语音

将文本合成为语音(TTS)。使用火山引擎豆包语音合成 API,支持流式合成、多种音色、语速/音调/音量调节、Markdown 过滤和 LaTeX 公式播报。当用户需要把文字转成语音、生成朗读音频、配音、旁白、播报,或提到「文字转语音」「TTS」「语音合成」「朗读」「配音」时使用本技能。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
95
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

byted-text-to-speech

Byted-Text-to-Speech 技能

基于火山引擎豆包语音合成(HTTP Chunked/SSE 单向流式-V3)将文本转为语音并保存为音频文件。

何时使用

当用户有以下需求时,优先使用本 skill:

  • - 需要把一段文字转成语音、朗读音频
  • 需要生成配音、旁白、播报、有声读物片段
  • 需要将代码注释、文档、文章等内容转为音频便于收听
  • 需要生成多语言语音(中文、英文等)
  • 用户提到「文字转语音」「TTS」「语音合成」「朗读」「配音」「念出来」「读给我听」
  • 用户没有明确说语音合成,但任务本质上需要将文本内容转为可播放的音频时

使用前检查

优先检查是否已配置以下凭证:

  • - MODELSPEECHAPI_KEY

如果缺少凭证,打开 references/setup-guide.md 查看开通、申请和配置方式,并给予用户开通建议

脚本参数

参数简写必填说明
--text-t要合成的文本内容
--output
-o | 否 | 输出音频文件路径(默认自动生成) | | --speaker | -s | 否 | 发音人,默认 zhfemalevvuranusbigtts,音色列表 | | --format | | 否 | 音频格式:mp3(默认)、pcm、ogg_opus | | --sample-rate | | 否 | 采样率,如 16000、24000(默认 24000) | | --speech-rate | | 否 | 语速 [-50, 100],100 代表 2.0 倍速,-50 代表 0.5 倍速,默认 0 | | --pitch-rate | | 否 | 音调 [-12, 12],默认 0 | | --loudness-rate | | 否 | 音量 [-50, 100],100 代表 2.0 倍音量,-50 代表 0.5 倍音量,默认 0 | | --bit-rate | | 否 | 比特率,对 mp3 和 ogg_opus 格式生效(如 64000、128000),默认 64000 | | --filter-markdown | | 否 | 过滤 markdown 语法(如 你好 读为你好),默认关闭 | | --enable-latex | | 否 | 启用 LaTeX 公式播报(使用 latex\_parser v2,自动开启 markdown 过滤),默认关闭 |

返回值说明

脚本输出 JSON,包含:

  • - status: success 或 error
  • local_path: 本地音频文件路径
  • format: 音频格式
  • error: 失败时的错误信息

请将 local_path 或可访问的音频 URL 返回给用户,便于播放或下载。

错误处理

  • - 若报错 PermissionError: MODELSPEECHAPIKEY ... 需在环境变量中配置:提示用户在 API Key 管理 获取并配置 MODELSPEECHAPI_KEY,写入 workspace 下的环境变量文件后重试。
  • 若返回 4xx/5xx 或业务错误码:根据错误信息提示用户检查文本内容、发音人 ID 及账号是否已开通豆包语音服务。

故障排查

  • - 缺少凭证:打开 references/setup-guide.md
  • 需要查 API 参数、字段、错误码:打开 references/docs-index.md
  • 如果脚本返回权限错误,优先检查服务是否已开通、凭证是否有效,给予用户明确的操作指引

参考资料

按需打开以下文件,不必默认全部加载:

  • - references/setup-guide.md:服务开通、凭证申请、环境变量配置
  • references/docs-index.md:API 文档索引、参数说明、音色列表、错误码速查

示例

bash

基本用法


python scripts/texttospeech.py -t 欢迎使用火山引擎语音合成服务。

指定发音人与输出格式

python scripts/texttospeech.py -t 这是一段测试语音。 -s zhfemalevvuranusbigtts -o output.mp3 --format mp3

指定语速与采样率

python scripts/texttospeech.py -t 语速和音调可调。 --speech-rate 10 --sample-rate 16000

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 byted-text-to-speech-1775986029 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 byted-text-to-speech-1775986029 技能

通过命令行安装

skillhub install byted-text-to-speech-1775986029

下载

⬇ 下载 byted-text-to-speech v1.0.0(免费)

文件大小: 10.95 KB | 发布时间: 2026-4-13 09:37

v1.0.0 最新 2026-4-13 09:37
byted-text-to-speech 1.0.0 初始发布

- 新增通过火山引擎豆包语音合成 API 将文本转为语音的能力,支持流式合成。
- 支持多种音色选择、语速/音调/音量调节、音频格式与采样率自定义。
- 增加 Markdown 过滤及 LaTeX 公式播报功能。
- 提供详细的错误提示与凭证配置指引。
- 输出合成后音频文件的本地路径及格式信息。

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部