Byted-Text-to-Speech Skill

基于火山引擎豆包语音合成（HTTP Chunked/SSE 单向流式-V3）将文本转为语音并保存为音频文件。

何时使用

当用户有以下需求时，优先使用本 skill：

- 需要把一段文字转成语音、朗读音频
需要生成配音、旁白、播报、有声读物片段
需要将代码注释、文档、文章等内容转为音频便于收听
需要生成多语言语音（中文、英文等）
用户提到「文字转语音」「TTS」「语音合成」「朗读」「配音」「念出来」「读给我听」
用户没有明确说"语音合成"，但任务本质上需要将文本内容转为可播放的音频时

使用前检查

优先检查是否已配置以下凭证：

- INLINECODE0

如果缺少凭证，打开 references/setup-guide.md 查看开通、申请和配置方式，并给予用户开通建议

脚本参数

参数	简写	必填	说明
INLINECODE2	INLINECODE3	是	要合成的文本内容
INLINECODE4

返回值说明

脚本输出 JSON，包含：

- status: "success" 或 INLINECODE23
INLINECODE24: 本地音频文件路径
INLINECODE25: 音频格式
INLINECODE26: 失败时的错误信息

请将 local_path 或可访问的音频 URL 返回给用户，便于播放或下载。

错误处理

- 若报错 PermissionError: MODEL_SPEECH_API_KEY ... 需在环境变量中配置：提示用户在 API Key 管理获取并配置 MODEL_SPEECH_API_KEY，写入 workspace 下的环境变量文件后重试。
若返回 4xx/5xx 或业务错误码：根据错误信息提示用户检查文本内容、发音人 ID 及账号是否已开通豆包语音服务。

故障排查

- 缺少凭证：打开 INLINECODE30
需要查 API 参数、字段、错误码：打开 INLINECODE31
如果脚本返回权限错误，优先检查服务是否已开通、凭证是否有效，给予用户明确的操作指引

参考资料

按需打开以下文件，不必默认全部加载：

- references/setup-guide.md：服务开通、凭证申请、环境变量配置
INLINECODE33：API 文档索引、参数说明、音色列表、错误码速查

示例

CODEBLOCK0

Byted-Text-to-Speech 技能

基于火山引擎豆包语音合成（HTTP Chunked/SSE 单向流式-V3）将文本转为语音并保存为音频文件。

何时使用

当用户有以下需求时，优先使用本 skill：

- 需要把一段文字转成语音、朗读音频
需要生成配音、旁白、播报、有声读物片段
需要将代码注释、文档、文章等内容转为音频便于收听
需要生成多语言语音（中文、英文等）
用户提到「文字转语音」「TTS」「语音合成」「朗读」「配音」「念出来」「读给我听」
用户没有明确说语音合成，但任务本质上需要将文本内容转为可播放的音频时

使用前检查

优先检查是否已配置以下凭证：

- MODELSPEECHAPI_KEY

如果缺少凭证，打开 references/setup-guide.md 查看开通、申请和配置方式，并给予用户开通建议

脚本参数

参数	简写	必填	说明
--text	-t	是	要合成的文本内容
--output

返回值说明

脚本输出 JSON，包含：

- status: success 或 error
local_path: 本地音频文件路径
format: 音频格式
error: 失败时的错误信息

请将 local_path 或可访问的音频 URL 返回给用户，便于播放或下载。

错误处理

- 若报错 PermissionError: MODELSPEECHAPIKEY ... 需在环境变量中配置：提示用户在 API Key 管理获取并配置 MODELSPEECHAPI_KEY，写入 workspace 下的环境变量文件后重试。
若返回 4xx/5xx 或业务错误码：根据错误信息提示用户检查文本内容、发音人 ID 及账号是否已开通豆包语音服务。

故障排查

- 缺少凭证：打开 references/setup-guide.md
需要查 API 参数、字段、错误码：打开 references/docs-index.md
如果脚本返回权限错误，优先检查服务是否已开通、凭证是否有效，给予用户明确的操作指引

参考资料

按需打开以下文件，不必默认全部加载：

- references/setup-guide.md：服务开通、凭证申请、环境变量配置
references/docs-index.md：API 文档索引、参数说明、音色列表、错误码速查

示例

bash

基本用法

python scripts/texttospeech.py -t 欢迎使用火山引擎语音合成服务。

指定发音人与输出格式
python scripts/texttospeech.py -t 这是一段测试语音。 -s zhfemalevvuranusbigtts -o output.mp3 --format mp3
指定语速与采样率
python scripts/texttospeech.py -t 语速和音调可调。 --speech-rate 10 --sample-rate 16000

byted-text-to-speech文本转语音