返回顶部
c

clonev语音克隆

Clone any voice and generate speech using Coqui XTTS v2. SUPER SIMPLE - provide a voice sample (6-30 sec WAV) and text, get cloned voice audio. Supports 14+ languages. Use when the user wants to (1) Clone their voice or someone else's voice, (2) Generate speech that sounds like a specific person, (3) Create personalized voice messages, (4) Multi-lingual voice cloning (speak any language with cloned voice).

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
2,004
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

clonev

CloneV 技能 - 语音克隆如此简单

⚠️ 人工智能模型的重要说明

不要尝试直接使用 Docker 容器。
不要尝试与 coqui-xtts 容器交互——该容器已损坏且正在重启。
不要尝试使用 API 或服务器。

仅使用脚本: scripts/clonev.sh

该脚本会自动处理所有操作。只需传入文本、语音样本和语言即可。



该技能的功能

从短音频样本中克隆任何语音,并以该语音生成新的语音。

输入

  • - 要朗读的文本
  • 语音样本(WAV 文件,6-30 秒)
  • 语言代码

输出:OGG 语音文件(克隆语音朗读该文本)

适用范围:任何语音!你的声音、名人、角色等。



你需要的唯一命令

bash
$(scripts/clonev.sh 你的文本 /路径/到/语音样本.wav 语言)

就这样!无需其他操作。



分步使用指南(适用于人工智能模型)

第 1 步:获取所需输入

  • - 要朗读的文本(来自用户)
  • 语音样本 WAV 文件的路径(来自用户)
  • 语言代码(来自用户,或默认为 en)

第 2 步:运行脚本

bash VOICE_FILE=$(scripts/clonev.sh 文本 /路径/到/样本.wav 语言)

第 3 步:使用输出

变量 $VOICE_FILE 现在包含生成的 OGG 文件的路径。

完整工作示例

示例 1:克隆语音并发送到 Telegram

bash

生成克隆语音

VOICE=$(/home/bernie/clawd/skills/clonev/scripts/clonev.sh 你好,这是我的克隆语音! /mnt/c/TEMP/Recording 25.wav en)

发送到 Telegram(作为语音消息)

message action=send channel=telegram asVoice=true filePath=$VOICE

示例 2:克隆捷克语语音

bash

生成捷克语语音

VOICE=$(/home/bernie/clawd/skills/clonev/scripts/clonev.sh Ahoj, tohle je můj hlas /mnt/c/TEMP/Recording 25.wav cs)

发送

message action=send channel=telegram asVoice=true filePath=$VOICE

示例 3:带检查的完整工作流程

bash #!/bin/bash

生成语音

VOICE=$(/home/bernie/clawd/skills/clonev/scripts/clonev.sh 任务完成! /路径/到/样本.wav en)

验证文件是否已创建

if [ -f $VOICE ]; then echo 成功!语音文件:$VOICE ls -lh $VOICE else echo 错误:语音文件未创建 fi

常用语言代码

代码语言使用示例
en英语scripts/clonev.sh Hello sample.wav en
cs
捷克语 | scripts/clonev.sh Ahoj sample.wav cs | | de | 德语 | scripts/clonev.sh Hallo sample.wav de | | fr | 法语 | scripts/clonev.sh Bonjour sample.wav fr | | es | 西班牙语 | scripts/clonev.sh Hola sample.wav es |

完整列表:en, cs, de, fr, es, it, pl, pt, tr, ru, nl, ar, zh, ja, hu, ko



语音样本要求

  • - 格式:WAV 文件
  • 时长:6-30 秒(最佳:10-15 秒)
  • 质量:清晰音频,无背景噪音
  • 内容:任何语音(实际词语无关紧要)

好的样本

  • - ✅ 某人清晰说话的录音
  • ✅ 背景无音乐或噪音
  • ✅ 音量一致

差的样本

  • - ❌ 音乐或歌曲
  • ❌ 严重背景噪音
  • ❌ 太短(< 6 秒)
  • ❌ 太长(> 30 秒)



⚠️ 重要说明

模型下载

  • - 首次使用下载约 1.87GB 模型(一次性)
  • 模型存储在:/mnt/c/TEMP/Docker-containers/coqui-tts/models-xtts/
  • 状态:✅ 已下载

处理时间

  • - 根据文本长度需要 20-40 秒
  • 这是正常情况——语音克隆计算密集

故障排除

命令未找到

确保你在技能目录中,或使用完整路径: bash /home/bernie/clawd/skills/clonev/scripts/clonev.sh 文本 sample.wav en

语音样本未找到

  • - 检查 WAV 文件的路径
  • 使用绝对路径(以 / 开头)
  • 确保文件存在:ls -la /路径/到/样本.wav

模型未找到

模型应自动下载。如果没有: bash cd /mnt/c/TEMP/Docker-containers/coqui-tts docker run --rm --entrypoint \ -v $(pwd)/models-xtts:/root/.local/share/tts \ ghcr.io/coqui-ai/tts:latest \ python3 -c from TTS.api import TTS; TTS(ttsmodels/multilingual/multi-dataset/xttsv2)

语音质量差

  • - 使用更清晰的语音样本
  • 确保无背景噪音
  • 尝试不同的样本(有些语音克隆效果更好)

快速参考卡(适用于人工智能模型)

用户:克隆我的声音并说你好
→ 获取:样本路径,文本=你好,语言=en
→ 运行:VOICE=$(/home/bernie/clawd/skills/clonev/scripts/clonev.sh 你好 /路径/到/样本.wav en)
→ 结果:$VOICE 包含 OGG 文件的路径
→ 发送:message action=send channel=telegram asVoice=true filePath=$VOICE

用户:让我说捷克语
→ 获取:样本路径,文本=Ahoj,语言=cs
→ 运行:VOICE=$(/home/bernie/clawd/skills/clonev/scripts/clonev.sh Ahoj /路径/到/样本.wav cs)
→ 发送:message action=send channel=telegram asVoice=true filePath=$VOICE



输出位置

生成的文件保存到:

/mnt/c/TEMP/Docker-containers/coqui-tts/output/clonev_output.ogg

脚本返回此路径,因此你可以直接使用。



总结

  1. 1. 仅使用脚本:scripts/clonev.sh
  2. 切勿尝试直接使用 Docker 容器
  3. 切勿尝试与 coqui-xtts 容器交互
  4. 脚本自动处理所有操作
  5. 返回准备发送的 OGG 文件路径

简单。只需使用脚本。



克隆任何语音。说任何语言。只需使用脚本。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 clonev-1776363788 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 clonev-1776363788 技能

通过命令行安装

skillhub install clonev-1776363788

下载

⬇ 下载 clonev v1.0.0(免费)

文件大小: 6.86 KB | 发布时间: 2026-4-17 15:15

v1.0.0 最新 2026-4-17 15:15
Initial release of CloneV skill – voice cloning made simple.

- Provides a one-command solution for cloning any voice and generating speech using Coqui XTTS v2.
- Supports 14+ languages; easily specify language code for multi-lingual speech.
- Requires a 6–30 second WAV voice sample and text; outputs an OGG file with cloned voice.
- Strict instructions: use only the included `scripts/clonev.sh` script (no direct Docker/API use).
- Detailed usage, troubleshooting, and reference provided in SKILL.md for quick, efficient deployment.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部