返回顶部
H

Her Voice赋予声音

Give your agent a voice. Use when the user wants the agent to speak, read aloud, or have voice responses.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
715
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

Her Voice

Her Voice 🎙️

为你的智能体赋予声音。 由 Kokoro TTS 驱动的音频响应——一个完全在设备上运行的紧凑、自然表达模型。

✨ 功能特性

得益于即时音频流技术,响应时间得到高度优化。100% 免费,无需 API 密钥。灵感来源于 Samantha 和 Sky。

  • - ⚡ 即时流式传输 — 音频边生成边播放,极低延迟
  • 👄 天使之声 — 前沿本地文本转语音模型 Kokoro TTS
  • 🧠 TTS 守护进程 — 将模型常驻内存以实现即时响应(可禁用以节省内存)
  • 🖥️ 持久模式 — 拖放音频、粘贴文本,用作语音工作站
  • 🔧 完全可配置 — 语音、速度、可视化器、通知音效
  • 🍎 MLX + PyTorch — Apple Silicon 原生 Metal 加速,其他平台使用 PyTorch 回退
  • 🎨 实时可视化器 — 60fps 浮动 LED 条,随语音实时响应(仅限 macOS)

首次运行设置

bash
python3 SKILL_DIR/scripts/setup.py

注意: SKILL_DIR 是本技能的根目录——智能体在运行命令时会自动解析。

设置向导将:

  1. 1. 检测平台并选择 TTS 引擎(Apple Silicon 上使用 MLX,其他平台使用 PyTorch)
  2. 查找或安装相应的 TTS 后端(mlx-audio 或 kokoro)
  3. 安装 espeak-ng(macOS 上使用 Homebrew,Linux 上使用 apt)
  4. 必要时修补 espeak 加载器(macOS 兼容性)
  5. 编译原生可视化器二进制文件(仅限 macOS)
  6. 下载 Kokoro 模型
  7. 在 ~/.her-voice/config.json 创建配置

随时检查状态:
bash
python3 SKILL_DIR/scripts/setup.py status

设置后:名称与发音

设置完成后,配置智能体和用户名称:
bash
python3 SKILLDIR/scripts/config.py set agentname Jackie
python3 SKILLDIR/scripts/config.py set username Matúš
python3 SKILLDIR/scripts/config.py set username_tts Mah-toosh

TTS 发音提示: 如果用户名非英语,请找出 Kokoro 能正确发音的英语音译拼写。将其存储在 usernametts 中,并在需要朗读名称时使用该拼写。真实名称保留在 user_name 中用于显示。

朗读文本

bash

基本用法


python3 SKILL_DIR/scripts/speak.py Hello, world!

跳过本次调用的可视化器

python3 SKILL_DIR/scripts/speak.py --no-viz Quick note

保存到文件而非播放

python3 SKILL_DIR/scripts/speak.py --save /tmp/output.wav Save this

覆盖语音或速度

python3 SKILLDIR/scripts/speak.py --voice afbella --speed 1.2 Faster!

从标准输入管道输入文本

echo Piped text | python3 SKILL_DIR/scripts/speak.py

选项

标志描述
--no-viz跳过本次调用的可视化器
--persist
播放结束后保持可视化器打开 | | --save PATH | 将音频保存为 WAV 文件而非播放 | | --voice NAME | 覆盖已配置的语音 | | --speed N | 覆盖已配置的速度倍率 | | --mode MODE | 覆盖可视化器模式(v2 或 classic) |

智能体工作流程

当用户需要语音响应时:

  1. 1. 检查语音模式 — 语音是否已启用或用户是否要求语音?
  2. 播放通知音效(TTS 生成时的即时反馈):
bash afplay /System/Library/Sounds/Blow.aiff &
  1. 3. 朗读响应:
bash python3 SKILL_DIR/scripts/speak.py Response text here
  1. 4. 始终同时提供文本和语音 — 可访问性很重要。

通知音效

通知音效在 TTS 生成(约 0.3-3 秒)时即时播放(约 0.1 秒)。这给用户即时反馈,表明智能体正在响应。

在 ~/.her-voice/config.json 中配置:
json
{
notification_sound: {
enabled: true,
sound: Blow
}
}

可用的 macOS 音效:Blow、Bottle、Frog、Funk、Glass、Hero、Morse、Ping、Pop、Purr、Sosumi、Submarine、Tink。位于 /System/Library/Sounds/。

TTS 守护进程

守护进程将 Kokoro 模型常驻内存,消除每次调用约 1.1 秒的启动开销。

守护进程自动解析 mlx-audio 虚拟环境——无需手动查找虚拟环境 Python。

bash

启动(在后台持续运行)


nohup python3 SKILL_DIR/scripts/daemon.py start > /tmp/her-voice-daemon.log 2>&1 & disown

状态

python3 SKILL_DIR/scripts/daemon.py status

停止

python3 SKILL_DIR/scripts/daemon.py stop

重启

python3 SKILL_DIR/scripts/daemon.py restart

speak.py 自动检测守护进程:可用时使用,否则回退到直接加载模型。

守护进程是可选的。 没有它,语音仍然可以工作——只是每次调用会慢约 1 秒,因为模型需要每次加载。跳过守护进程可节省约 2.3GB 内存。

注意: 守护进程在模型完全加载并准备好接受连接后才会写入其 PID 文件和套接字。它们位于 ~/.her-voice/ 中,具有受限权限(仅所有者可访问)。守护进程在重启后不会保留——如果需要,请在重启后再次启动。

可视化器

一个浮动叠加层,包含三个动画 LED 条,实时响应语音。60fps,原生 macOS(Cocoa + AVFoundation)。仅限 macOS — 在其他平台上,音频播放时不显示可视化器。

模式

  • - v2(默认)— 三层纯红色,中心原始振幅,两侧带延迟
  • classic — 原始平滑渐变外观

控制
按键操作
ESC退出
Space
暂停/恢复(文件模式) |

| ← → | 快退/快进 ±5 秒(文件模式) | | ⌘V | 粘贴要朗读的文本(持久模式) |

持久模式

在播放之间保持可视化器在屏幕上。用作独立语音工作站: bash

以持久模式启动(保持打开,空闲呼吸动画)

~/.her-voice/bin/her-voice-viz --persist

流模式 + 持久(语音结束后保持打开)

python3 SKILL_DIR/scripts/speak.py --persist Hello!

在持久模式下:

  • - 拖放音频文件(.wav、.mp3、.aiff、.m4a)到可视化器上进行播放
  • ⌘V 粘贴剪贴板文本 → 直接从 TTS 守护进程流式传输,带有完整的可视化器动画
  • 空闲呼吸 — 等待输入时中心条微妙脉冲

独立使用

bash

使用可视化器播放文件

~/.her-voice/bin/her-voice-viz --audio /path/to/file.wav

演示模式(模拟音频)

~/.her-voice/bin/her-voice-viz --demo

流式传输原始 PCM

cat audio.raw | ~/.her-voice/bin/her-voice-viz --stream --sample-rate 24000

禁用可视化器

bash python3 SKILL_DIR/scripts/config.py set visualizer.enabled false

配置

配置文件:~/.her-voice/config.json

bash

查看所有设置


python3 SKILL_DIR/scripts/config.py status

获取值

python3 SKILL_DIR/scripts/config.py get voice

设置值(嵌套键使用点号表示法)

python3 SKILL_DIR/scripts/config.py set speed 1.1 python3 SKILL_DIR/scripts/config.py set visualizer.mode classic

关键设置

默认值描述
agent_name
智能体

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 her-voice-1776420053 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 her-voice-1776420053 技能

通过命令行安装

skillhub install her-voice-1776420053

下载

⬇ 下载 Her Voice v1.0.2(免费)

文件大小: 28.21 KB | 发布时间: 2026-4-17 19:20

v1.0.2 最新 2026-4-17 19:20
**Improved daemon security, config clarity, and doc hints.**

- TTS daemon files (PID, socket) are now stored in `~/.her-voice/` with owner-only permissions for better security.
- Added documentation tip: agent now automatically resolves `SKILL_DIR` when running commands.
- Improved configuration instructions for clarity and accuracy.
- Updated changelog and documentation to match these behavioral updates.
- No breaking changes; functionality remains the same.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部