返回顶部
m

macos-local-voicemacOS本地语音

Local STT and TTS on macOS using native Apple capabilities. Speech-to-text via yap (Apple Speech.framework), text-to-speech via say + ffmpeg. Fully offline, no API keys required. Includes voice quality detection and smart voice selection.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
1,811
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

macos-local-voice

macOS 本地语音

在 macOS 上完全本地化的语音转文字(STT)和文字转语音(TTS)。无需 API 密钥,无需网络,无需云端。所有处理均在设备本地完成。

系统要求

  • - macOS(推荐 Apple Silicon,Intel 也可用)
  • 环境变量 PATH 中包含 yap 命令行工具 — 通过 brew install finnvoor/tools/yap 安装
  • 环境变量 PATH 中包含 ffmpeg(可选,用于 ogg/opus 格式输出)— brew install ffmpeg
  • say 和 osascript 为 macOS 内置工具

语音转文字(STT)

使用 Apple 设备端语音识别将音频文件转录为文字。

bash
node {baseDir}/scripts/stt.mjs <音频文件> [语言区域]

  • - 音频文件:音频文件路径(支持 ogg、m4a、mp3、wav 等格式)
  • 语言区域:可选参数,例如 zhCN、enUS、ja_JP。省略时使用系统默认设置。
  • 将转录的文字输出到标准输出。

支持的 STT 语言区域

使用 node {baseDir}/scripts/stt.mjs --locales 列出所有支持的语言区域。

主要语言区域:enUS、enGB、zhCN、zhTW、zhHK、jaJP、koKR、frFR、deDE、esES、ptBR、ruRU、viVN、thTH。

语言检测建议

  • - 如果用户最近的消息为中文 → 使用 zhCN
  • 如果为英文 → 使用 enUS
  • 如果混合或不确定 → 尝试不指定语言区域(使用系统默认)

文字转语音(TTS)

使用 macOS 原生 TTS 将文字转换为音频文件。

bash
node {baseDir}/scripts/tts.mjs <文字> [语音名称] [输出路径]

  • - 文字:需要朗读的文字
  • 语音名称:可选参数,例如 Yue (Premium)、Tingting、Ava (Premium)。省略时根据文字语言自动选择最佳可用语音。
  • 输出路径:可选参数,默认为 ~/.openclaw/media/outbound/ 目录下带时间戳的文件。
  • 将生成的音频文件路径输出到标准输出。
  • 如果 ffmpeg 可用,输出格式为 ogg/opus(适合消息平台)。否则为 aiff 格式。

发送语音消息

生成音频文件后,使用 message 工具发送:

message action=send media=<来自 tts.sh 的路径> asVoice=true

语音管理

列出可用语音、检查就绪状态或查找特定语言的最佳语音:

bash
node {baseDir}/scripts/voices.mjs list [语言区域] # 列出语音,可按语言区域筛选
node {baseDir}/scripts/voices.mjs check <名称> # 检查指定语音是否已下载并就绪
node {baseDir}/scripts/voices.mjs best <语言区域> # 获取指定语言区域的最佳质量语音

质量等级

  • - 1 = 精简版(低质量,始终可用)
  • 2 = 增强版(中等质量,可能需要下载)
  • 3 = 高级版(最高质量,需从系统设置下载)

如果语音不可用

告知用户:语音 X 尚未下载。请前往 系统设置 → 辅助功能 → 朗读内容 → 系统语音 → 管理语音 进行下载。

注意事项

  • - 如果请求的语音不可用,say 命令会静默回退到默认语音(退出码为 0,无错误信息)。务必在调用 tts.mjs 指定语音名称前使用 voices.mjs check 进行检查。
  • 高级语音(例如 Yue (Premium)、Ava (Premium))音质明显更好,但需要用户手动下载。
  • Siri 语音无法通过语音合成 API 访问。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 macos-local-voice-1776420070 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 macos-local-voice-1776420070 技能

通过命令行安装

skillhub install macos-local-voice-1776420070

下载

⬇ 下载 macos-local-voice v1.0.0(免费)

文件大小: 7.32 KB | 发布时间: 2026-4-17 19:12

v1.0.0 最新 2026-4-17 19:12
Initial release: Node.js rewrite. STT (yap) + TTS (say) + voice detection (JXA/AVFoundation). Fully offline, no API keys.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部