返回顶部
q

qwencloud-audio-ttsQwen语音合成

[QwenCloud] Synthesize speech from text with Qwen TTS models. TRIGGER when: user wants to convert text to speech, create voiceovers, generate audio narration, read text aloud, build TTS applications, mentions speech synthesis/voice generation/audio output from text, or explicitly invokes this skill by name (e.g. use qwencloud-audio-tts). DO NOT TRIGGER when: user wants speech recognition/ASR, text generation without audio, non-Qwen audio tasks.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
102
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

qwencloud-audio-tts

Agent 设置:如果你的代理不会自动加载技能(例如 Claude Code),
请在每个会话中查看一次 agent-compatibility.md

Qwen 音频 TTS(文本转语音)

使用 Qwen TTS 模型从文本合成自然语音。
此技能是 qwencloud/qwencloud-ai 的一部分。

技能目录

使用此技能的内部文件来执行和学习。当默认路径失败或你需要详细信息时,按需加载参考文件。

位置用途
scripts/tts.pyQwen TTS(HTTP API)— qwen3-tts-flash, qwen3-tts-instruct-flash
scripts/tts_cosyvoice.py
CosyVoice(WebSocket API)— 需要 dashscope SDK |
| references/cosyvoice-guide.md | CosyVoice 设置、音色、示例、错误 |
| references/execution-guide.md | 备用方案:curl(标准、指令、流式)、代码生成 |
| references/prompt-guide.md | 语音文本格式化、指令模板、音色选择 |
| references/api-guide.md | API 补充说明 |
| references/sources.md | 官方文档 URL |
| references/agent-compatibility.md | 代理自检:为不自动加载技能的代理在项目配置中注册技能 |

安全

切勿以明文形式输出任何 API 密钥或凭证。 始终使用变量引用(shell 中使用 $DASHSCOPEAPIKEY,Python 中使用 os.environ[DASHSCOPEAPIKEY])。任何对凭证的检查或检测必须非明文:仅报告状态(例如“已设置”/“未设置”、“有效”/“无效”),切勿输出值。切勿显示可能包含密钥的 .env 或配置文件内容。

当 API 密钥未配置时,切勿要求用户直接提供。 相反,应帮助创建一个包含占位符(DASHSCOPEAPIKEY=sk-your-key-here)的 .env 文件,并指导用户从 QwenCloud 控制台 替换为他们的实际密钥。仅当用户明确请求时才写入实际的密钥值。

密钥兼容性

脚本需要标准的 QwenCloud API 密钥(sk-...)。编程计划密钥(sk-sp-...)无法使用 — TTS 模型在编程计划上不可用,且编程计划不支持原生 QwenCloud API。脚本在启动时会检测 sk-sp- 密钥并打印警告。如果安装了 qwencloud-ops-auth,请参阅其 references/codingplan.md 了解完整详情。

模型选择

Qwen TTS(HTTP API)— 使用 scripts/tts.py

模型用例备注
qwen3-tts-flash推荐(标准)— 快速、多语言性价比高,广泛可用
qwen3-tts-instruct-flash
指令引导的风格控制 | 通过指令控制语气/情感 |

CosyVoice(WebSocket API)— 使用 scripts/tts_cosyvoice.py

模型用例
cosyvoice-v3-flash高质量,快速
cosyvoice-v3-plus
最高质量 |

注意:CosyVoice 需要 dashscope SDK 并使用不同的音色。请参阅 cosyvoice-guide.md

  1. 1. 用户指定了模型 → 使用相应的脚本:
- qwen3-tts-* → scripts/tts.py - cosyvoice-* → scripts/tts_cosyvoice.py
  1. 2. 当模型选择取决于能力、场景或定价时,请咨询 qwencloud-model-selector 技能。
  2. 无信号,任务明确 → 通过 tts.py 使用 qwen3-tts-flash(标准任务的默认选项)。

⚠️ 重要:上述模型列表是某个时间点的快照,可能已过时。模型可用性
频繁变化。在做出模型决策之前,请始终查看官方模型列表
以获取权威、最新的目录。

可用音色

音色描述脚本
Cherry, Ethan, SerenaQwen TTS 系统音色tts.py
longanyang, longanhuan, longhuhuv3
CosyVoice 已验证音色 | ttscosyvoice.py |

完整列表api-guide.md(Qwen TTS)· cosyvoice-guide.md(CosyVoice)

执行

⚠️ 多个文件:在单次会话中生成多个文件时,你必须在每个文件名后附加数字后缀(例如 out1.wav、out2.wav)以防止覆盖。

Qwen TTS(HTTP API)— tts.py

前提条件

  • - API 密钥:使用非明文检查确认 DASHSCOPEAPIKEY(或 QWENAPIKEY)已设置(例如在 shell 中:[ -n $DASHSCOPEAPIKEY ];仅报告“已设置”或“未设置”,切勿输出密钥值)。如果未设置:如果可用,运行 qwencloud-ops-auth 技能;否则指导用户从 QwenCloud 控制台 获取密钥,并通过 .env 文件(在项目根目录或当前目录执行 echo DASHSCOPEAPI_KEY=sk-your-key-here >> .env)或环境变量进行设置。脚本会在当前工作目录和项目根目录中搜索 .env。技能可能独立安装 — 不要假设 qwencloud-ops-auth 存在。
  • Python 3.9+(仅标准库,无需 pip 安装

环境检查

在首次执行前,确认 Python 可用:

bash
python3 --version # 必须为 3.9+

如果找不到 python3,请尝试 python --version 或 py -3 --version。如果 Python 不可用或版本低于 3.9,请跳转到 execution-guide.md 中的路径 2(curl)

默认:运行脚本

脚本路径:脚本位于此技能目录(包含此 SKILL.md 的目录)的 scripts/ 子目录中。你必须首先找到此技能的安装目录,然后始终使用完整的绝对路径来执行脚本。 不要假设脚本在当前工作目录中。不要在执行前使用 cd 切换目录。

执行说明:在前台运行所有脚本 — 等待标准输出;不要后台运行。

发现:首先运行 python3 <此技能目录>/scripts/tts.py --help 查看所有可用参数。

bash
python3 <此技能目录>/scripts/tts.py \
--request {text:Hello, this is a test.,voice:Cherry} \
--output output/qwencloud-audio-tts/ \
--print-response

参数描述
--request {...}JSON 请求体
--file path.json
从文件加载请求 | | --output dir/ | 将音频和响应 JSON 保存到目录 | | --print-response | 将响应打印到标准输出 | | --model ID | 覆盖模型 | | --voice NAME | 覆盖音色 |

验证结果

  • - 退出码 0 + 输出包含带有 output.audio 字段的有效 JSON → 成功
  • 非零退出、HTTP 错误、空响应或错误 JSON → 失败
  • 执行后检查:确认输出音频文件存在且大小非零(ls -la <输出目录>)
  • 强制 — 标准错误信号检查:确认结果后,扫描命令的标准错误输出中是否包含 [ACTIONREQUIRED] 或 [UPDATEAVAILABLE]。如果存在任一信号,你必须在回复用户之前按照下方更新检查中的说明进行操作。

失败时

如果脚本失败,将错误输出与下面的诊断表进行匹配以确定解决方案。如果没有匹配项,请阅读 execution-guide.md 了解替代路径:curl

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 qwencloud-audio-tts-1775934516 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 qwencloud-audio-tts-1775934516 技能

通过命令行安装

skillhub install qwencloud-audio-tts-1775934516

下载

⬇ 下载 qwencloud-audio-tts v0.1.0(免费)

文件大小: 31 KB | 发布时间: 2026-4-12 11:10

v0.1.0 最新 2026-4-12 11:10
Initial release of qwencloud-audio-tts skill.

- Enables text-to-speech (TTS) synthesis using QwenCloud models for voice generation, narration, and TTS app building.
- Supports both Qwen TTS (HTTP API) and CosyVoice (WebSocket API) with separate scripts and clear model/voice selection guidance.
- Provides detailed setup, security, API key handling, and model compatibility instructions.
- Includes troubleshooting steps, sample execution commands, and documentation references for advanced usage.
- Ensures robust file output handling and post-execution diagnostics to guide users through common issues.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部