返回顶部
o

openclaw-mlx-audioOpenClaw音频集成

Local TTS/STT integration for OpenClaw using mlx-audio - Zero API keys, Zero cloud dependency

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.2.1
安全检测
已通过
241
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

openclaw-mlx-audio

技能名称: openclaw-mlx-audio
详细描述:

OpenClaw MLX Audio

本地支持多语言文本转语音 (TTS) 和语音转文本 (STT),完全在 Apple Silicon 设备上运行,无需云服务,保护数据隐私。

功能

  • - 🗣️ TTS 文本转语音: 支持中文、英文等多种语言
  • 🎤 STT 语音转文本: 高准确率语音识别
  • 🎭 声音克隆: 使用参考音频克隆声音
  • 🔒 完全本地: 无需 API Key,数据不出设备

安装

bash

安装依赖


brew install ffmpeg uv
uv tool install mlx-audio --prerelease=allow

安装插件

cp -r openclaw-mlx-audio ~/.openclaw/extensions/

重启 OpenClaw

openclaw gateway restart

使用

TTS 命令

bash

状态查询


/ mlx-tts status

测试生成

/ mlx-tts test 你好,这是测试语音

模型列表

/ mlx-tts models

STT 命令

bash

状态查询


/ mlx-stt status

转录音频

/ mlx-stt transcribe /path/to/audio.wav

模型列表

/ mlx-stt models

工具调用

TTS:
json
{
tool: mlx_tts,
parameters: {
action: generate,
text: Hello World,
outputPath: /tmp/speech.mp3
}
}

STT:
json
{
tool: mlx_stt,
parameters: {
action: transcribe,
audioPath: /tmp/audio.wav,
language: zh
}
}

支持模型

TTS 模型

模型语言速度质量
mlx-community/Kokoro-82M-bf168+⚡⚡⚡良好
mlx-community/Qwen3-TTS-12Hz-0.6B-Base-bf16
中文/英文/日文/韩文 | ⚡⚡ | 较好 | | mlx-community/Qwen3-TTS-12Hz-1.7B-VoiceDesign-bf16 | 中文/英文/日文/韩文 | ⚡ | 最佳 |

STT 模型

模型语言速度精度
mlx-community/whisper-large-v3-turbo-asr-fp1699+⚡⚡⚡良好
mlx-community/Qwen3-ASR-1.7B-8bit
中文/英文/日文/韩文 | ⚡⚡ | 较好 | | mlx-community/whisper-large-v3 | 99+ | ⚡⚡ | 最佳 |

测试

自动化测试: 17 项 (100% 通过)
真人测试: 11 项 Discord 测试
总体评分: ⭐⭐⭐⭐ (3.85/5.0)

运行测试:
bash
bash test/run_tests.sh

配置

在 openclaw.json 中添加:

json
{
plugins: {
allow: [@openclaw/mlx-audio],
entries: {
@openclaw/mlx-audio: {
enabled: true,
config: {
tts: {
enabled: true,
model: mlx-community/Qwen3-TTS-12Hz-0.6B-Base-bf16,
langCode: zh
},
stt: {
enabled: true,
model: mlx-community/Qwen3-ASR-1.7B-8bit,
language: zh
}
}
}
}
}
}

系统要求

  • - macOS Apple Silicon (M1/M2/M3)
  • Node.js 18+
  • Python 3.10+
  • ffmpeg
  • uv

链接

  • - GitHub: https://github.com/gandli/openclaw-mlx-audio
  • OpenClaw: https://docs.openclaw.ai
  • ClawHub: https://clawhub.ai

许可证

MIT

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 openclaw-mlx-audio-1776280874 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 openclaw-mlx-audio-1776280874 技能

通过命令行安装

skillhub install openclaw-mlx-audio-1776280874

下载

⬇ 下载 openclaw-mlx-audio v0.2.1(免费)

文件大小: 42.8 KB | 发布时间: 2026-4-17 15:38

v0.2.1 最新 2026-4-17 15:38
- Initial release of source files, test scripts, documentation, and packaging for version 0.2.1
- Added all core source code, Python runtime scripts, and build artifacts
- Introduced comprehensive documentation and test plans (automation and manual/Discord tests)
- Included installation scripts and full OpenClaw integration files
- Changelog, progress, and release process documentation now available

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部