返回顶部
a

aliyun-cosyvoice-voice-design阿里云语音设计

Use when designing custom voices with Alibaba Cloud Model Studio CosyVoice customization models, especially cosyvoice-v3.5-plus or cosyvoice-v3.5-flash, from a voice prompt plus preview text before using the returned voice_id in TTS.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
116
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

aliyun-cosyvoice-voice-design

技能名称: aliyun-cosyvoice-voice-design
详细描述:
类别: provider

模型工作室 CosyVoice 语音设计

使用 CosyVoice 语音注册 API,通过自然语言语音描述创建定制语音。

关键模型名称

使用 model=voice-enrollment 和以下 target_model 值之一:

  • - cosyvoice-v3.5-plus
  • cosyvoice-v3.5-flash
  • cosyvoice-v3-plus
  • cosyvoice-v3-flash

本仓库推荐默认值:

  • - target_model=cosyvoice-v3.5-plus

区域与兼容性

  • - cosyvoice-v3.5-plus 和 cosyvoice-v3.5-flash 仅在中国大陆部署模式(北京端点)可用。
  • 在国际部署模式(新加坡端点)下,cosyvoice-v3-plus 和 cosyvoice-v3-flash 不支持语音克隆/设计。
  • target_model 必须与后续的语音合成模型匹配。

端点

  • - 国内:https://dashscope.aliyuncs.com/api/v1/services/audio/tts/customization
  • 国际:https://dashscope-intl.aliyuncs.com/api/v1/services/audio/tts/customization

前提条件

  • - 在环境中设置 DASHSCOPEAPIKEY,或将 dashscopeapikey 添加到 ~/.alibabacloud/credentials。

标准化接口 (cosyvoice.voice_design)

请求

  • - model(字符串,可选):固定为 voice-enrollment
  • targetmodel(字符串,可选):默认为 cosyvoice-v3.5-plus
  • prefix(字符串,必填):仅限字母和数字,最多10个字符
  • voiceprompt(字符串,必填):最多500个字符,仅支持中文或英文
  • previewtext(字符串,必填):最多200个字符,中文或英文
  • languagehints(字符串数组,可选):zh 或 en,应与 previewtext 匹配
  • samplerate(整数,可选):例如 24000
  • response_format(字符串,可选):例如 wav

响应

  • - voiceid(字符串)
  • requestid(字符串)
  • status(字符串,可选)

操作指南

  • - 保持 voiceprompt 具体:音色、年龄范围、语速、情感、清晰度和场景。
  • 如果使用 languagehints,它应与 preview_text 的语言匹配。
  • 定制语音名称在生成的后端命名规范中包含 -vd- 标记。

本地辅助脚本

准备一个标准化的请求 JSON:

bash
python skills/ai/audio/aliyun-cosyvoice-voice-design/scripts/preparecosyvoicedesign_request.py \
--target-model cosyvoice-v3.5-plus \
--prefix announcer \
--voice-prompt 沉稳的中年男性播音员,低沉有磁性,语速平稳,吐字清晰。 \
--preview-text 各位听众朋友,大家好,欢迎收听晚间新闻。 \
--language-hint zh

验证

bash
mkdir -p output/aliyun-cosyvoice-voice-design
for f in skills/ai/audio/aliyun-cosyvoice-voice-design/scripts/*.py; do
python3 -m py_compile $f
done
echo pycompileok > output/aliyun-cosyvoice-voice-design/validate.txt

通过标准:命令退出码为0,且生成 output/aliyun-cosyvoice-voice-design/validate.txt。

输出与证据

  • - 将工件、命令输出和 API 响应摘要保存在 output/aliyun-cosyvoice-voice-design/ 下。
  • 在证据文件中包含 targetmodel、prefix、voiceprompt 和 preview_text。

参考资料

  • - references/api_reference.md
  • references/sources.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 aliyun-cosyvoice-voice-design-1775887749 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 aliyun-cosyvoice-voice-design-1775887749 技能

通过命令行安装

skillhub install aliyun-cosyvoice-voice-design-1775887749

下载

⬇ 下载 aliyun-cosyvoice-voice-design v1.0.0(免费)

文件大小: 6.02 KB | 发布时间: 2026-4-12 08:55

v1.0.0 最新 2026-4-12 08:55
Initial release of aliyun-cosyvoice-voice-design.

- Provides a normalized interface to design custom voices using Alibaba Cloud Model Studio CosyVoice, especially with v3.5 models.
- Documents required fields, supported model names, API endpoints, and deployment region compatibility.
- Offers detailed operational guidance for effective voice prompt creation and validation.
- Includes a local helper script for preparing and validating request JSONs.
- Supplies output management and evidence collection instructions.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部