ElevenLabs Skill
Core tools for interacting with the ElevenLabs API for sound generation, music, and voice management.
Setup
See SETUP.md for prerequisites and setup instructions.
Models
| Model | ID | Use Case |
|---|
| Eleven v3 | INLINECODE0 | ⭐ Best for expressive/creative audio. Supports audio tags (square brackets): [laughs], [sighs], [whispers], [excited], [grumpy voice], [clears throat], etc. Use for storytelling, characters, demos. |
| Multilingual v2 |
eleven_multilingual_v2 | Stable multilingual. No audio tags. Good for straightforward narration. |
| Turbo v2.5 |
eleven_turbo_v2_5 | Low-latency, good for non-English (German TTS). Required for realtime/conversational. |
| Flash v2.5 |
eleven_flash_v2_5 | Fastest, lowest cost. |
v3 Audio Tags (square brackets, NOT XML/SSML)
[laughs], [chuckles], [sighs], [clears throat], [whispers], [shouts]
[excited], [sad], [angry], [warmly], [deadpan], [sarcastic]
[grumpy voice], [philosophical], [whiny voice], [resigned]
[laughs hard], [sighs deeply], [pause]
Tags can be placed anywhere in text. Combine freely. v3 understands emotional context deeply.
Output Formats
All scripts support multiple output formats via --format:
| Format | Description |
|---|
| INLINECODE11 | MP3, 44.1kHz, 128kbps (default) |
| INLINECODE12 |
MP3, 44.1kHz, 192kbps |
|
mp3_44100_96 | MP3, 44.1kHz, 96kbps |
|
mp3_44100_64 | MP3, 44.1kHz, 64kbps |
|
mp3_44100_32 | MP3, 44.1kHz, 32kbps |
|
mp3_24000_48 | MP3, 24kHz, 48kbps |
|
mp3_22050_32 | MP3, 22.05kHz, 32kbps |
|
opus_48000_192 | Opus, 48kHz, 192kbps ⭐ best for AirPlay |
|
opus_48000_128 | Opus, 48kHz, 128kbps |
|
opus_48000_96 | Opus, 48kHz, 96kbps |
|
opus_48000_64 | Opus, 48kHz, 64kbps |
|
opus_48000_32 | Opus, 48kHz, 32kbps |
|
pcm_16000 | Raw PCM, 16kHz |
|
pcm_22050 | Raw PCM, 22.05kHz |
|
pcm_24000 | Raw PCM, 24kHz |
|
alaw_8000 | A-law, 8kHz (telephony) |
Tools
1. Speech (speech.py)
Text-to-speech using ElevenLabs voices.
CODEBLOCK1
2. Sound Effects (sfx.py)
Generate sound effects and short audio clips.
CODEBLOCK2
3. Music Generation (music.py)
Generate full musical compositions or instrumental tracks.
CODEBLOCK3
4. Voices (voices.py)
List available voices and their IDs.
CODEBLOCK4
5. Voice Cloning (voiceclone.py)
Create instant voice clones from audio samples.
Security: by default this script will only read files from:
Copy your samples there (or pass --sample-dir). Reading files outside the sample directory is blocked.
CODEBLOCK5
6. Quota & Usage (quota.py)
Check subscription quota and usage statistics.
CODEBLOCK6
Output:
CODEBLOCK7
ElevenLabs 技能
用于与 ElevenLabs API 交互的核心工具,支持声音生成、音乐和语音管理。
设置
请参阅 SETUP.md 了解前提条件和设置说明。
模型
| 模型 | ID | 用途 |
|---|
| Eleven v3 | elevenv3 | ⭐ 最适合表现力/创意音频。支持音频标签(方括号):[笑]、[叹气]、[低语]、[兴奋]、[暴躁语气]、[清嗓子]等。适用于讲故事、角色扮演、演示。 |
| Multilingual v2 |
elevenmultilingual_v2 | 稳定的多语言模型。不支持音频标签。适合直接叙述。 |
| Turbo v2.5 | eleven
turbov2_5 | 低延迟,适合非英语(德语TTS)。实时/对话场景必需。 |
| Flash v2.5 | eleven
flashv2_5 | 最快,成本最低。 |
v3 音频标签(方括号,非 XML/SSML)
[笑]、[轻笑]、[叹气]、[清嗓子]、[低语]、[喊叫]
[兴奋]、[悲伤]、[愤怒]、[温暖]、[面无表情]、[讽刺]
[暴躁语气]、[哲学]、[抱怨语气]、[无奈]
[大笑]、[深叹]、[停顿]
标签可放置在文本任意位置。可自由组合。v3 能深入理解情感上下文。
输出格式
所有脚本通过 --format 支持多种输出格式:
| 格式 | 描述 |
|---|
| mp344100128 | MP3,44.1kHz,128kbps(默认) |
| mp344100192 |
MP3,44.1kHz,192kbps |
| mp3
4410096 | MP3,44.1kHz,96kbps |
| mp3
4410064 | MP3,44.1kHz,64kbps |
| mp3
4410032 | MP3,44.1kHz,32kbps |
| mp3
2400048 | MP3,24kHz,48kbps |
| mp3
2205032 | MP3,22.05kHz,32kbps |
| opus
48000192 | Opus,48kHz,192kbps ⭐ 最适合 AirPlay |
| opus
48000128 | Opus,48kHz,128kbps |
| opus
4800096 | Opus,48kHz,96kbps |
| opus
4800064 | Opus,48kHz,64kbps |
| opus
4800032 | Opus,48kHz,32kbps |
| pcm_16000 | 原始 PCM,16kHz |
| pcm_22050 | 原始 PCM,22.05kHz |
| pcm_24000 | 原始 PCM,24kHz |
| alaw_8000 | A-law,8kHz(电话语音) |
工具
1. 语音合成(speech.py)
使用 ElevenLabs 语音进行文本转语音。
bash
基本用法
python3 {baseDir}/scripts/speech.py 你好世界 -v
-o output.mp3
带格式选项
python3 {baseDir}/scripts/speech.py 你好世界 -v id> -o output.pcm --format pcm44100
带语音设置
python3 {baseDir}/scripts/speech.py 你好 -v -o out.mp3 --stability 0.7 --similarity 0.8
2. 音效生成(sfx.py)
生成音效和短音频片段。
bash
生成音效
python3 {baseDir}/scripts/sfx.py 电影感轰鸣 -o boom.mp3
生成循环音效
python3 {baseDir}/scripts/sfx.py 低保真嘻哈节拍 --duration 10 --loop -o beat.mp3
不同格式
python3 {baseDir}/scripts/sfx.py 嗖嗖声 -o whoosh.pcm --format pcm_44100
3. 音乐生成(music.py)
生成完整的音乐作品或器乐音轨。
bash
生成器乐前奏
python3 {baseDir}/scripts/music.py --prompt 欢快6秒新闻开场音,器乐 --length-ms 6000 -o intro.mp3
生成背景垫音
python3 {baseDir}/scripts/music.py --prompt 柔和氛围合成器垫音 --length-ms 30000 -o bed.mp3
高质量MP3
python3 {baseDir}/scripts/music.py --prompt 爵士钢琴 --length-ms 10000 -o jazz.mp3 --output-format mp344100192
4. 语音管理(voices.py)
列出可用语音及其ID。
bash
列出语音
python3 {baseDir}/scripts/voices.py
JSON输出
python3 {baseDir}/scripts/voices.py --json
5. 语音克隆(voiceclone.py)
从音频样本创建即时语音克隆。
安全说明: 默认情况下,此脚本仅读取以下目录中的文件:
- - ~/.openclaw/elevenlabs/voiceclone-samples/
请将样本复制到该目录(或使用 --sample-dir 指定)。禁止读取样本目录外的文件。
bash
从音频文件克隆(将样本放入 ~/.openclaw/elevenlabs/voiceclone-samples)
python3 {baseDir}/scripts/voiceclone.py --name 我的声音 --files sample1.mp3 sample2.mp3
使用自定义样本目录
python3 {baseDir}/scripts/voiceclone.py --name 安迪 --sample-dir ./samples --files a.m4a b.m4a --language de --gender male
带描述和降噪
python3 {baseDir}/scripts/voiceclone.py --name 安迪 --files a.m4a b.m4a --description 德语男性 --denoise
6. 配额与用量(quota.py)
查看订阅配额和使用统计。
bash
显示当前配额
python3 {baseDir}/scripts/quota.py
包含按语音的使用明细
python3 {baseDir}/scripts/quota.py --usage
最近7天使用情况
python3 {baseDir}/scripts/quota.py --usage --days 7
JSON输出
python3 {baseDir}/scripts/quota.py --json
输出:
📊 ElevenLabs 配额
=======================================
套餐: 专业版(活跃)— 年付
字符数: 66.6K / 500.0K(13.3%)
[███░░░░░░░░░░░░░░░░░░░░░░░░░░░]
重置时间: 2026-02-18(29天后)
语音数: 22 / 160(IVC:✓)
专业语音: 0 / 1(PVC:✓)