返回顶部
s

senseaudio-voice-cloner语音克隆指南

Guide users through SenseAudio platform voice cloning, then generate TTS with cloned `voice_id` values. Use when users want to clone voices, manage cloned voice slots, or synthesize audio with a cloned voice.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
406
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

senseaudio-voice-cloner

SenseAudio 语音克隆器

引导用户完成平台端的语音克隆,然后使用生成的克隆 voice_id 生成个性化 TTS。

该技能的功能

  • - 解释官方 SenseAudio 语音克隆工作流程
  • 验证样本是否适合克隆
  • 帮助用户管理克隆语音槽位和 voice_id 值
  • 通过官方 TTS API 使用克隆语音生成 TTS
  • 为克隆语音应用可选的发音词典控制

凭证和依赖规则

  • - 从 SENSEAUDIOAPIKEY 读取 API 密钥。
  • 仅以 Authorization: Bearer 形式发送认证信息。
  • 不要将 API 密钥放在查询参数、日志或保存的示例中。
  • 如果使用 Python 辅助工具,此技能需要 python3、requests 和 pydub。
  • pydub 仅用于可选的本地音频验证。

官方语音克隆约束

使用以下总结的官方 SenseAudio 平台语音克隆规则:

  • - 克隆本身仅在平台端进行;没有直接创建克隆语音的公开 API。
  • 用户必须先在平台上克隆,然后获取生成的 voice_id 供 API 使用。
  • 平台克隆的样本要求:
- 时长:3-30 秒 - 大小:<=50MB - 格式:MP3、WAV 或 AAC - 录音环境:安静且无回声
  • - 克隆会消耗用户套餐中的一个语音槽位。
  • 删除未使用的克隆语音可释放槽位。

克隆语音的官方 TTS 约束

在用户已有克隆 voiceid 后,使用 /v1/t2av2 上的官方 TTS API:

  • - 标准 TTS 模型:SenseAudio-TTS-1.0
  • voicesetting.voiceid 为必填项,可以是克隆语音 ID
  • 可选的音频格式:mp3、wav、pcm、flac
  • 可选的采样率:8000、16000、22050、24000、32000、44100
  • 可选的 MP3 比特率:32000、64000、128000、256000
  • 可选的声道数:1 或 2
  • 可选的发音 dictionary 仅适用于克隆语音,且需要 model=SenseAudio-TTS-1.5

推荐工作流程

  1. 1. 确认克隆状态:
  • - 如果用户还没有克隆语音,先引导他们进行平台克隆流程。
  • 如果已有克隆语音,询问 voice_id。
  1. 2. 在必要时验证源样本:
  • - 本地检查时长、文件类型和基本音频质量。
  • 当样本有噪音、混响或超出文档规定的尺寸/时长限制时发出警告。
  1. 3. 使用克隆语音生成 TTS:
  • - 使用 SenseAudio-TTS-1.0 进行常规合成。
  • 仅在需要发音 dictionary 时使用 SenseAudio-TTS-1.5。
  1. 4. 保持输出安全且可复现:
  • - 在写入文件前解码返回的十六进制音频。
  • 保持文件名确定性,避免记录密钥。

平台引导辅助

python
def guidevoicecloning():
return
在 SenseAudio 平台上克隆语音:

  1. 1. 打开 https://senseaudio.cn/platform/voice-clone
  2. 准备一段干净的语音样本:
- 时长:3-30 秒 - 格式:MP3 / WAV / AAC - 大小:50MB 或更小 - 环境:安静、低回声、语音清晰
  1. 3. 在平台上上传或录制样本
  2. 等待平台完成训练
  3. 从语音列表中复制生成的 voiceid
  4. 在后续的 TTS API 调用中使用该 voiceid

最小化 TTS 辅助

python
import binascii
import os

import requests

APIKEY = os.environ[SENSEAUDIOAPI_KEY]
APIURL = https://api.senseaudio.cn/v1/t2av2

def generatewithclonedvoice(text, voiceid, speed=1.0, vol=1.0, pitch=0):
response = requests.post(
API_URL,
headers={
Authorization: fBearer {API_KEY},
Content-Type: application/json,
},
json={
model: SenseAudio-TTS-1.0,
text: text,
stream: False,
voice_setting: {
voiceid: voiceid,
speed: speed,
vol: vol,
pitch: pitch,
},
audio_setting: {
format: mp3,
sample_rate: 32000,
bitrate: 128000,
channel: 2,
},
},
timeout=60,
)
response.raiseforstatus()
data = response.json()
return binascii.unhexlify(data[data][audio]), data.get(trace_id)

发音词典模式

仅用于需要明确多音字纠正的克隆语音。

python
def generatewithdictionary(text, voice_id, dictionary):
response = requests.post(
API_URL,
headers={
Authorization: fBearer {API_KEY},
Content-Type: application/json,
},
json={
model: SenseAudio-TTS-1.5,
text: text,
voicesetting: {voiceid: voice_id},
dictionary: dictionary,
},
timeout=60,
)
response.raiseforstatus()
return response.json()

词典条目遵循官方格式:

  • - original:源文本片段
  • replacement:发音覆盖,如 [hao4]干净

可选的本地验证

python
from pydub import AudioSegment

def validatecloningaudio(audio_file):
audio = AudioSegment.fromfile(audiofile)
issues = []

if not 3000 <= len(audio) <= 30000:
issues.append(durationoutof_range)
if audio.frame_rate < 16000:
issues.append(sampleratelow)
if audio.channels > 2:
issues.append(toomanychannels)
if not audio_file.lower().endswith((.mp3, .wav, .aac)):
issues.append(unsupported_extension)

return {
valid: not issues,
issues: issues,
duration_ms: len(audio),
samplerate: audio.framerate,
channels: audio.channels,
}

输出选项

  • - 使用克隆语音合成的 MP3 或 WAV 音频
  • 平台克隆和槽位管理的 Markdown 说明
  • 包含 voice_id 标签和本地描述的 JSON 元数据
  • 源样本的可选验证报告

安全注意事项

  • - 不要声称可以通过公开 API 发起语音克隆。
  • 不要混淆 APIKEY 和 SENSEAUDIOAPIKEY;始终使用 SENSEAUDIOAPIKEY。
  • 默认使用 SenseAudio-TTS-1.0;将 SenseAudio-TTS-1.5 保留给克隆语音的词典使用。
  • 将 voiceid 值视为用户特定的操作标识符。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 voice-clone-1776290282 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 voice-clone-1776290282 技能

通过命令行安装

skillhub install voice-clone-1776290282

下载

⬇ 下载 senseaudio-voice-cloner v1.0.2(免费)

文件大小: 3.3 KB | 发布时间: 2026-4-17 16:30

v1.0.2 最新 2026-4-17 16:30
No user-facing or functional changes in this version.

- No file changes were detected for version 1.0.2.
- Documentation, behavior, and supported features remain unchanged from previous versions.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部