返回顶部
a

azure-speech-ttsAzure语音合成

Azure Speech TTS skill for generating local audio files from text or SSML with Azure Speech. Use when the user asks to use Azure Speech / Azure TTS / Microsoft TTS / speech synthesis / text-to-speech / SSML, choose voices, control speaking rate/pitch/style, or export MP3/WAV/OGG/PCM audio.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
191
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

azure-speech-tts

Azure Speech TTS

使用 Azure Speech 将文本或 SSML 转换为 download/ 目录下的本地音频文件。

技能功能

  • - 将纯文本合成为语音
  • 直接合成完整的 SSML 负载
  • 选择语音、输出格式、语速、音调、风格和角色
  • 将结果保存为本地音频文件并输出 JSON 摘要

配置

本技能使用一个小型默认配置文件加环境变量。

默认配置文件

文件:

  • - config.json

默认值:

  • - defaultvoice:zh-CN-Yunqi:DragonHDOmniLatestNeural
  • defaultformat:mp3
  • defaultoutputdir:download
  • defaulttimeoutseconds:60

密钥值

在本地 shell 环境中设置:

  • - AZURESPEECHKEY
  • AZURESPEECHREGION

可选环境变量覆盖

  • - AZURESPEECHVOICE
  • AZURESPEECHFORMAT

优先级

按以下顺序使用:

  1. 1. CLI 标志
  2. 环境变量
  3. config.json
  4. 内置默认值

快速开始

bash
python3 scripts/azure_tts.py \
--text 你好,这是一段测试语音。 \
--voice zh-CN-Yunqi:DragonHDOmniLatestNeural \
--format mp3 \
--output download/test.mp3

对于 SSML:

bash
python3 scripts/azure_tts.py \
--ssml-file temp/input.ssml \
--format wav \
--output download/test.wav

工作流程

  1. 1. 判断输入是纯文本还是完整 SSML。
  2. 使用 --text / --text-file 进行普通叙述。
  3. 仅在负载已包含完整 文档时使用 --ssml / --ssml-file。
  4. 选择语音和输出格式,或让 config.json 提供默认值。
  5. 运行 scripts/azure_tts.py。
  6. 将生成的音频路径返回给用户。

规则

  • - 除非用户需要停顿、强调、多语音内容或表现力风格,否则优先使用纯文本。
  • --ssml 输入必须包含完整的 根元素。
  • 如果未设置其他值,默认语音为 zh-CN-Yunqi:DragonHDOmniLatestNeural。
  • 默认输出文件夹为 download/。
  • 如果用户未指定格式,则使用默认的 MP3 输出。
  • 不要将密钥放在 config.json 中。

常见格式

格式映射和示例请参见 references/azure-speech-cheatsheet.md。

脚本支持的短别名:

  • - mp3
  • wav
  • pcm
  • ogg

实用选项

  • - --voice:Azure 语音名称,例如 en-US-AriaNeural
  • --language:纯文本模式的 SSML xml:lang
  • --rate:语速,例如 +10%
  • --pitch:音调调整,例如 +2st
  • --style:表现力风格,如 cheerful、sad、chat
  • --style-degree:表现力风格的强度
  • --role:支持的语音角色
  • --save-ssml:将生成的 SSML 写入文件以供检查
  • --dry-run:打印生成的 SSML 而不调用 Azure

输出

辅助脚本会写入音频文件并输出类似以下的 JSON:

json
{
ok: true,
output_path: download/test.mp3,
format: audio-24khz-48kbitrate-mono-mp3,
voice: zh-CN-Yunqi:DragonHDOmniLatestNeural,
language: zh-CN,
bytes: 123456
}

使用输出的 output_path 作为交付路径。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 azure-speech-tts-1775935635 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 azure-speech-tts-1775935635 技能

通过命令行安装

skillhub install azure-speech-tts-1775935635

下载

⬇ 下载 azure-speech-tts v1.0.2(免费)

文件大小: 8.18 KB | 发布时间: 2026-4-12 09:07

v1.0.2 最新 2026-4-12 09:07
- Added _meta.json metadata file to the repository.
- No changes made to skill functionality or documentation content.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部