Local TTS/STT integration for OpenClaw using mlx-audio - Zero API keys, Zero cloud dependency
技能名称: openclaw-mlx-audio
详细描述:
本地支持多语言文本转语音 (TTS) 和语音转文本 (STT),完全在 Apple Silicon 设备上运行,无需云服务,保护数据隐私。
bash
bash
bash
TTS:
json
{
tool: mlx_tts,
parameters: {
action: generate,
text: Hello World,
outputPath: /tmp/speech.mp3
}
}
STT:
json
{
tool: mlx_stt,
parameters: {
action: transcribe,
audioPath: /tmp/audio.wav,
language: zh
}
}
| 模型 | 语言 | 速度 | 质量 |
|---|---|---|---|
| mlx-community/Kokoro-82M-bf16 | 8+ | ⚡⚡⚡ | 良好 |
| mlx-community/Qwen3-TTS-12Hz-0.6B-Base-bf16 |
| 模型 | 语言 | 速度 | 精度 |
|---|---|---|---|
| mlx-community/whisper-large-v3-turbo-asr-fp16 | 99+ | ⚡⚡⚡ | 良好 |
| mlx-community/Qwen3-ASR-1.7B-8bit |
自动化测试: 17 项 (100% 通过)
真人测试: 11 项 Discord 测试
总体评分: ⭐⭐⭐⭐ (3.85/5.0)
运行测试:
bash
bash test/run_tests.sh
在 openclaw.json 中添加:
json
{
plugins: {
allow: [@openclaw/mlx-audio],
entries: {
@openclaw/mlx-audio: {
enabled: true,
config: {
tts: {
enabled: true,
model: mlx-community/Qwen3-TTS-12Hz-0.6B-Base-bf16,
langCode: zh
},
stt: {
enabled: true,
model: mlx-community/Qwen3-ASR-1.7B-8bit,
language: zh
}
}
}
}
}
}
MIT
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 openclaw-mlx-audio-1776280874 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 openclaw-mlx-audio-1776280874 技能
skillhub install openclaw-mlx-audio-1776280874
文件大小: 42.8 KB | 发布时间: 2026-4-17 15:38