返回顶部
k

kittentts-whatsappKittenTTS语音消息

WhatsApp voice notes via KittenTTS. Converts KittenTTS 24kHz WAV output to WhatsApp-compatible 16kHz OGG Opus using ffmpeg. Install dependencies first — see setup. Network: downloads ~25-80MB TTS model on first run from Hugging Face.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.4
安全检测
已通过
112
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

kittentts-whatsapp

KittenTTS WhatsApp 语音

使用KittenTTS + ffmpeg将文本生成为WhatsApp兼容的语音笔记。专门解决因格式不匹配导致的静默失败问题:KittenTTS输出24kHz WAV → 通过ffmpeg转换为16kHz OGG Opus → 作为WhatsApp语音笔记发送。

⚠️ 安装前请阅读。 此技能会安装系统包并下载大型机器学习模型。请参阅下方设置部分。

系统依赖

依赖项安装命令大小说明
ffmpegapt-get install -y ffmpeg~30MB大多数发行版仓库中可用
kittentts
pip3 install kittentts --break-system-packages | 首次运行从Hugging Face拉取约25-80MB | Python包 | | libopus | 随ffmpeg捆绑 | — | OGG编码支持 | | soundfile | 由kittentts拉取 | — | Python包 |

网络调用

  • - 首次运行:根据所选模型大小从huggingface.co/KittenML下载TTS模型(约25-80MB)
  • 无需API密钥 — 模型下载后可完全离线使用
  • 设置HF_TOKEN环境变量以避免模型下载时未认证的速率限制

模型选项

模型参数大小Hugging Face ID
nano (int8)1500万25MBKittenML/kitten-tts-nano-0.8-int8
nano
1500万 | 56MB | KittenML/kitten-tts-nano-0.8-fp32 | | micro | 4000万 | 41MB | KittenML/kitten-tts-micro-0.8 | | mini | 8000万 | 80MB | KittenML/kitten-tts-mini-0.8 |

默认:kitten-tts-mini-0.8(最佳质量)。在scripts/tts_walkie.sh中更改。

设置

在使用此技能前手动运行以下命令:

bash

1. 系统包(需要root/特权权限)


apt-get install -y ffmpeg

2. Python包

pip3 install kittentts --break-system-packages

3. 可选:设置Hugging Face令牌以避免速率限制

echo export HFTOKEN=hfyourtokenhere >> ~/.bashrc

安装依赖后重启OpenClaw,以便新包在PATH中生效。

使用方法

仅TTS(无转录)

bash
bash scripts/tts_walkie.sh 您的消息在这里 Bella

输出:/tmp/walkie_reply.ogg(16kHz OGG Opus,WhatsApp就绪)

仅转录(可选 — 需要whisper)

bash

安装whisper(一次性,根据模型大小约140MB-1.4GB)


pip3 install whisper --break-system-packages

bash scripts/transcribe.sh /path/to/audio.ogg [model]

模型:tiny | base | small | medium | large(默认:base)

语音

可用语音:Bella, Jasper, Luna, Bruno, Rosie, Hugo, Kiki, Leo

默认:Bella

安全说明

  • - 音频文件写入私有/tmp/kittentts-walkie/目录(权限700)— 仅运行用户可读取。
  • WAV中间文件在转换后立即清理;仅保留OGG用于发送。
  • 设置VOICE_SPEED环境变量以调整语速(默认:1.0)。

文件

kittentts-whatsapp/
├── SKILL.md
└── scripts/
├── tts_walkie.sh # TTS + ffmpeg转换(现在使用语速设置)
└── transcribe.sh # whisper转录(可选)

⚠️ 特权安装警告

依赖安装命令使用--break-system-packages和apt-get install -y。这些需要root权限并修改系统包。如果您在受管系统上运行,请先审查。

故障排除

音频已发送但静音或被WhatsApp拒绝:
→ 运行ffprobe -v quiet -printformat json -showstreams /tmp/walkie_reply.ogg
→ 必须显示codecname: opus和samplerate: 48000(或16000)。如果未显示,则ffmpeg链失败。

TTS生成缓慢:
→ 在scripts/tts_walkie.sh中切换到较小的模型(nano代替mini)。

Hugging Face下载速率限制:
→ 在环境中设置HF_TOKEN。免费账户的速率限制较低。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 kittentts-whatsapp-1776017907 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 kittentts-whatsapp-1776017907 技能

通过命令行安装

skillhub install kittentts-whatsapp-1776017907

下载

⬇ 下载 kittentts-whatsapp v1.0.4(免费)

文件大小: 4.36 KB | 发布时间: 2026-4-13 10:46

v1.0.4 最新 2026-4-13 10:46
v1.0.4: Fixed /tmp world-readable issue — audio now written to mode-700 /tmp/kittentts-walkie/. Fixed unused speed parameter bug — VOICE_SPEED now passed to tts.generate(). WAV intermediates cleaned up after conversion. Added Security Notes section.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部