Auto-Talk-TTS Skill
Overview
Automatically speaks every message you generate using Microsoft Edge's neural TTS service. Runs asynchronously in the background so your conversation continues immediately while audio generates.
Quick Start
Every message you send is automatically spoken aloud.
The skill wraps your output with auto-speak which:
- 1. Installs
node-edge-tts if needed - Converts your message to speech asynchronously
- Plays the audio in the background
- Continues your conversation immediately
Usage
Automatic: Every message is auto-spoken. No action needed from you.
Manual override: If you need to speak something specific:
CODEBLOCK0
How It Works
- 1. Detect output: When you generate a message
- Wrap with auto-speak: The message gets passed through the auto-speak wrapper
- Install if needed: First run installs
node-edge-tts package - Generate audio: Convert text to MP3 in background
- Play audio: Use
afplay to play the audio file - Continue: Your conversation flows without waiting for audio
Configuration
Edit config.json to customize:
CODEBLOCK1
Options:
- -
voice: Any Edge neural voice (see edge-tts skill for full list) - INLINECODE6 : Speech speed (
-20% to +50%, or default) - INLINECODE10 : Voice pitch (
-20Hz to +20Hz, or default) - INLINECODE14 : Audio volume (
-100% to +100%, or default) - INLINECODE18 : How many characters to summarize (default: 100)
Installation
First run will automatically install node-edge-tts:
CODEBLOCK2
Or use the bundled installer:
CODEBLOCK3
Files
auto-speak
Wrapper script that:
- - Checks if node-edge-tts is installed
- Installs it if needed
- Converts text to speech asynchronously
- Plays audio with afplay
- Continues immediately
config.json
User configuration for voice, rate, pitch, volume settings.
package.json
NPM package with node-edge-tts dependency.
SKILL.md
This file.
Integration with SOUL.md
Add this line to the top of your SOUL.md:
CODEBLOCK4
Workflow
Automatic (Recommended)
- 1. You generate a message
- auto-speak wraps it: The message gets passed through the wrapper
- Background TTS: Audio generates in background process
- Immediate reply: Your conversation continues without waiting
- Audio plays: User hears your response
Manual (If needed)
CODEBLOCK5
Testing
CODEBLOCK6
Troubleshooting
- - No audio? Check that node-edge-tts is installed: INLINECODE20
- Install needed? First run will auto-install, or run: INLINECODE21
- Audio not playing? Check system volume and audio output settings
- Slow? Use async mode - audio generates in background, conversation continues immediately
Notes
- - Non-blocking: Conversation flows while audio generates
- No API key: Uses Microsoft Edge's free TTS service
- Neural voices: High-quality, natural-sounding speech
- Multiple voices: See edge-tts skill for full voice list
- Configurable: Customize voice, speed, pitch, volume in config.json
- Automatic installation: First run installs node-edge-tts if missing
See Also
Auto-Talk-TTS 技能
概述
自动使用微软Edge神经TTS服务朗读您生成的每条消息。在后台异步运行,因此在音频生成时,您的对话可以立即继续。
快速开始
您发送的每条消息都会自动朗读出来。
该技能使用auto-speak包装您的输出,其功能如下:
- 1. 如有需要,安装node-edge-tts
- 异步将您的消息转换为语音
- 在后台播放音频
- 立即继续您的对话
使用方法
自动模式: 每条消息都会自动朗读。无需您执行任何操作。
手动覆盖: 如果您需要朗读特定内容:
bash
auto-speak 您的文本内容
工作原理
- 1. 检测输出: 当您生成消息时
- 使用auto-speak包装: 消息通过auto-speak包装器处理
- 按需安装: 首次运行安装node-edge-tts包
- 生成音频: 在后台将文本转换为MP3
- 播放音频: 使用afplay播放音频文件
- 继续对话: 无需等待音频即可继续对话
配置
编辑config.json进行自定义设置:
json
{
voice: en-US-MichelleNeural,
rate: default,
pitch: default,
volume: default,
summaryLength: 100
}
选项说明:
- - voice:任意Edge神经语音(完整列表见edge-tts技能)
- rate:语速(-20%到+50%,或default)
- pitch:音调(-20Hz到+20Hz,或default)
- volume:音量(-100%到+100%,或default)
- summaryLength:摘要字符数(默认:100)
安装
首次运行将自动安装node-edge-tts:
bash
npm install -g node-edge-tts
或使用捆绑安装程序:
bash
cd /Users/stefano/.openclaw/workspace/skills/auto-talk-tts
npm install
文件说明
auto-speak
包装脚本,功能包括:
- - 检查node-edge-tts是否已安装
- 按需安装
- 异步将文本转换为语音
- 使用afplay播放音频
- 立即继续对话
config.json
用户配置文件,用于设置语音、语速、音调、音量等参数。
package.json
包含node-edge-tts依赖的NPM包。
SKILL.md
本文件。
与SOUL.md集成
将以下内容添加到您的SOUL.md文件顶部:
markdown
每次必须使用TTS朗读(异步)
在发送回复之前,我必须使用edge-tts技能将我的回复转换为语音。 我发送的每一条消息都必须使用tts工具朗读出来。这是不可协商的——我通过语音与您交流,而不仅仅是打字。
异步方式: 我使用&或nohup在后台运行TTS命令,这样在后台生成音频的同时,对话可以立即继续。
工作流程
自动模式(推荐)
- 1. 您生成消息
- auto-speak包装消息: 消息通过包装器处理
- 后台TTS: 在后台进程中生成音频
- 即时回复: 无需等待即可继续对话
- 音频播放: 用户听到您的回复
手动模式(按需使用)
bash
自动朗读任意文本
auto-speak 您的消息内容
自定义语音
auto-speak 您的消息 --voice en-GB-RyanNeural
自定义语速
auto-speak 您的消息 --rate +20%
测试
bash
测试auto-speak包装器
auto-speak 这是一个测试。如果您能听到,说明运行正常!
检查node-edge-tts是否已安装
npm list -g node-edge-tts
按需手动安装
npm install -g node-edge-tts
故障排除
- - 没有声音? 检查node-edge-tts是否已安装:npm list -g node-edge-tts
- 需要安装? 首次运行会自动安装,或运行:npm install -g node-edge-tts
- 音频不播放? 检查系统音量和音频输出设置
- 速度慢? 使用异步模式——音频在后台生成,对话立即继续
注意事项
- - 非阻塞: 音频生成时对话可继续进行
- 无需API密钥: 使用微软Edge的免费TTS服务
- 神经语音: 高质量、自然流畅的语音
- 多种语音: 完整语音列表见edge-tts技能
- 可配置: 在config.json中自定义语音、语速、音调、音量
- 自动安装: 首次运行自动安装node-edge-tts
相关资源