Azure Speech TTS

使用 Azure Speech 将文本或 SSML 转换为 download/ 目录下的本地音频文件。

技能功能

- 将纯文本合成为语音
直接合成完整的 SSML 负载
选择语音、输出格式、语速、音调、风格和角色
将结果保存为本地音频文件并输出 JSON 摘要

配置

本技能使用一个小型默认配置文件加环境变量。

默认配置文件

文件：

- config.json

默认值：

- defaultvoice：zh-CN-Yunqi:DragonHDOmniLatestNeural
defaultformat：mp3
defaultoutputdir：download
defaulttimeoutseconds：60

密钥值

在本地 shell 环境中设置：

- AZURESPEECHKEY
AZURESPEECHREGION

可选环境变量覆盖

- AZURESPEECHVOICE
AZURESPEECHFORMAT

优先级

按以下顺序使用：

1. CLI 标志
环境变量
config.json
内置默认值

快速开始

bash
python3 scripts/azure_tts.py \
--text 你好，这是一段测试语音。 \
--voice zh-CN-Yunqi:DragonHDOmniLatestNeural \
--format mp3 \
--output download/test.mp3

对于 SSML：

bash
python3 scripts/azure_tts.py \
--ssml-file temp/input.ssml \
--format wav \
--output download/test.wav

工作流程

1. 判断输入是纯文本还是完整 SSML。
使用 --text / --text-file 进行普通叙述。
仅在负载已包含完整文档时使用 --ssml / --ssml-file。
选择语音和输出格式，或让 config.json 提供默认值。
运行 scripts/azure_tts.py。
将生成的音频路径返回给用户。

规则

- 除非用户需要停顿、强调、多语音内容或表现力风格，否则优先使用纯文本。
--ssml 输入必须包含完整的根元素。
如果未设置其他值，默认语音为 zh-CN-Yunqi:DragonHDOmniLatestNeural。
默认输出文件夹为 download/。
如果用户未指定格式，则使用默认的 MP3 输出。
不要将密钥放在 config.json 中。

常见格式

格式映射和示例请参见 references/azure-speech-cheatsheet.md。

脚本支持的短别名：

- mp3
wav
pcm
ogg

实用选项

- --voice：Azure 语音名称，例如 en-US-AriaNeural
--language：纯文本模式的 SSML xml:lang
--rate：语速，例如 +10%
--pitch：音调调整，例如 +2st
--style：表现力风格，如 cheerful、sad、chat
--style-degree：表现力风格的强度
--role：支持的语音角色
--save-ssml：将生成的 SSML 写入文件以供检查
--dry-run：打印生成的 SSML 而不调用 Azure

输出

辅助脚本会写入音频文件并输出类似以下的 JSON：

json
{
ok: true,
output_path: download/test.mp3,
format: audio-24khz-48kbitrate-mono-mp3,
voice: zh-CN-Yunqi:DragonHDOmniLatestNeural,
language: zh-CN,
bytes: 123456
}

使用输出的 output_path 作为交付路径。

azure-speech-ttsAzure语音合成

azure-speech-tts

Azure Speech TTS

What this skill does

Configuration

Default config file

Secret values

Optional environment overrides

Precedence

Quick start

Workflow

Rules

Common formats

Useful options

Output

Azure Speech TTS

技能功能

配置

默认配置文件

密钥值

可选环境变量覆盖

优先级

快速开始

工作流程

规则

常见格式

实用选项

输出

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

azure-speech-ttsAzure语音合成

azure-speech-tts

Azure Speech TTS

What this skill does

Configuration

Default config file

Secret values

Optional environment overrides

Precedence

Quick start

Workflow

Rules

Common formats

Useful options

Output

Azure Speech TTS

技能功能

配置

默认配置文件

密钥值

可选环境变量覆盖

优先级

快速开始

工作流程

规则

常见格式

实用选项

输出

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement