返回顶部
a

aliyun-cosyvoice-voice-clone阿里云声音克隆

Use when creating cloned voices with Alibaba Cloud Model Studio CosyVoice customization models, especially cosyvoice-v3.5-plus or cosyvoice-v3.5-flash, from reference audio and then reusing the returned voice_id in later TTS calls.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
83
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

aliyun-cosyvoice-voice-clone

技能名称: aliyun-cosyvoice-voice-clone
详细描述:
类别: 提供者

模型工作室 CosyVoice 声音克隆

使用 CosyVoice 声音注册 API,从公开参考音频创建克隆声音。

关键模型名称

使用 model=voice-enrollment 和以下 target_model 值之一:

  • - cosyvoice-v3.5-plus
  • cosyvoice-v3.5-flash
  • cosyvoice-v3-plus
  • cosyvoice-v3-flash
  • cosyvoice-v2

本仓库推荐默认值:

  • - target_model=cosyvoice-v3.5-plus

区域与兼容性

  • - cosyvoice-v3.5-plus 和 cosyvoice-v3.5-flash 仅在中国大陆部署模式(北京端点)下可用。
  • 在国际部署模式(新加坡端点)下,cosyvoice-v3-plus 和 cosyvoice-v3-flash 不支持声音克隆/设计。
  • 注册时使用的 target_model 必须与后续语音合成中使用的模型一致,否则合成会失败。

端点

  • - 国内:https://dashscope.aliyuncs.com/api/v1/services/audio/tts/customization
  • 国际:https://dashscope-intl.aliyuncs.com/api/v1/services/audio/tts/customization

前提条件

  • - 在环境中设置 DASHSCOPEAPIKEY,或将 dashscopeapikey 添加到 ~/.alibabacloud/credentials。
  • 为注册样本提供公开音频 URL。

标准化接口 (cosyvoice.voice_clone)

请求

  • - model (字符串,可选):固定为 voice-enrollment
  • targetmodel (字符串,可选):默认为 cosyvoice-v3.5-plus
  • prefix (字符串,必填):仅限字母/数字,最多 10 个字符
  • voicesampleurl (字符串,必填):公开音频 URL
  • languagehints (字符串数组,可选):仅使用第一个元素
  • maxpromptaudiolength (浮点数,可选):仅适用于 cosyvoice-v3.5-plus、cosyvoice-v3.5-flash、cosyvoice-v3-flash
  • enablepreprocess (布尔值,可选):仅适用于 cosyvoice-v3.5-plus、cosyvoice-v3.5-flash、cosyvoice-v3-flash

响应

  • - voiceid (字符串):在后续 TTS 调用中用作 voice 参数
  • requestid (字符串)
  • usage.count (数字,可选)

操作指南

  • - 对于中文方言参考音频,保持 languagehints=[zh];在合成时通过文本或 instruct 控制方言风格。
  • 对于 cosyvoice-v3.5-plus,支持的 languagehints 包括 zh、en、fr、de、ja、ko、ru、pt、th、id、vi。
  • 避免频繁调用注册接口;每次调用都会创建新的自定义声音并消耗配额。

本地辅助脚本

准备标准化请求 JSON:

bash
python skills/ai/audio/aliyun-cosyvoice-voice-clone/scripts/preparecosyvoiceclone_request.py \
--target-model cosyvoice-v3.5-plus \
--prefix myvoice \
--voice-sample-url https://example.com/voice.wav \
--language-hint zh

验证

bash
mkdir -p output/aliyun-cosyvoice-voice-clone
for f in skills/ai/audio/aliyun-cosyvoice-voice-clone/scripts/*.py; do
python3 -m py_compile $f
done
echo pycompileok > output/aliyun-cosyvoice-voice-clone/validate.txt

通过标准:命令退出码为 0 且生成 output/aliyun-cosyvoice-voice-clone/validate.txt。

输出与证据

  • - 将产物、命令输出和 API 响应摘要保存在 output/aliyun-cosyvoice-voice-clone/ 下。
  • 在证据文件中包含 target_model、prefix 和样本 URL。

参考

  • - references/api_reference.md
  • references/sources.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 aliyun-cosyvoice-voice-clone-1775887756 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 aliyun-cosyvoice-voice-clone-1775887756 技能

通过命令行安装

skillhub install aliyun-cosyvoice-voice-clone-1775887756

下载

⬇ 下载 aliyun-cosyvoice-voice-clone v1.0.0(免费)

文件大小: 5.73 KB | 发布时间: 2026-4-12 08:55

v1.0.0 最新 2026-4-12 08:55
Initial release of aliyun-cosyvoice-voice-clone skill for Alibaba Cloud Model Studio CosyVoice.

- Supports creating cloned voices using CosyVoice enrollment from public reference audio.
- Compatible with models: cosyvoice-v3.5-plus, cosyvoice-v3.5-flash, cosyvoice-v3-plus, cosyvoice-v3-flash, and cosyvoice-v2.
- Allows specifying language hints, audio sample URL, and additional enrollment options.
- Returns a reusable voice_id for future TTS synthesis.
- Includes usage guidance, API endpoint details, and helper script for preparing enrollment requests.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部