返回顶部
d

discord-voiceDiscord语音

Real-time voice conversations in Discord voice channels with Claude AI

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.6
安全检测
已通过
5,320
下载量
免费
免费
8
收藏
概述
安装方式
版本历史

discord-voice

Clawdbot 的 Discord 语音插件

在 Discord 语音频道中进行实时语音对话。加入语音频道、说话,你的话语将被转录、由 Claude 处理,并以语音形式回复。

功能特性

  • - 加入/离开语音频道:通过斜杠命令、CLI 或代理工具实现
  • 语音活动检测 (VAD):自动检测用户何时说话
  • 语音转文字:支持 Whisper API(OpenAI)、Deepgram 或本地 Whisper(离线)
  • 流式 STT:通过 Deepgram WebSocket 实现实时转录(延迟降低约 1 秒)
  • 代理集成:转录的语音通过 Clawdbot 代理进行处理
  • 文字转语音:支持 OpenAI TTS、ElevenLabs 或 Kokoro(本地/离线)
  • 音频播放:在语音频道中以语音形式回复
  • 打断支持:用户开始说话时立即停止播放
  • 自动重连:自动心跳监测,断开时自动重连

系统要求

  • - 具有语音权限的 Discord 机器人(连接、说话、使用语音活动)
  • STT 和 TTS 提供商的 API 密钥
  • 语音相关的系统依赖:
- ffmpeg(音频处理) - @discordjs/opus 和 sodium-native 的原生构建工具

安装指南

1. 安装系统依赖

bash

Ubuntu/Debian


sudo apt-get install ffmpeg build-essential python3

Fedora/RHEL

sudo dnf install ffmpeg gcc-c++ make python3

macOS

brew install ffmpeg

2. 通过 ClawdHub 安装

bash
clawdhub install discord-voice

或手动安装:

bash
cd ~/.clawdbot/extensions
git clone discord-voice
cd discord-voice
npm install

3. 在 clawdbot.json 中配置

json5
{
plugins: {
entries: {
discord-voice: {
enabled: true,
config: {
sttProvider: local-whisper,
ttsProvider: openai,
ttsVoice: nova,
vadSensitivity: medium,
allowedUsers: [], // 空数组表示允许所有用户
silenceThresholdMs: 1500,
maxRecordingMs: 30000,
openai: {
apiKey: sk-..., // 或使用 OPENAIAPIKEY 环境变量
},
},
},
},
},
}

4. Discord 机器人设置

确保你的 Discord 机器人拥有以下权限:

  • - 连接 - 加入语音频道
  • 说话 - 播放音频
  • 使用语音活动 - 检测用户说话

将这些权限添加到机器人的 OAuth2 URL 中,或在 Discord 开发者门户中进行配置。

配置选项

选项类型默认值描述
enabledbooleantrue启用/禁用插件
sttProvider
string | local-whisper | whisper、deepgram 或 local-whisper | | streamingSTT | boolean | true | 使用流式 STT(仅 Deepgram,快约 1 秒) | | ttsProvider | string | openai | openai 或 elevenlabs | | ttsVoice | string | nova | TTS 的语音 ID | | vadSensitivity | string | medium | low、medium 或 high | | bargeIn | boolean | true | 用户说话时停止播放 | | allowedUsers | string[] | [] | 允许的用户 ID(空数组表示全部) | | silenceThresholdMs | number | 1500 | 处理前的静音时长(毫秒) | | maxRecordingMs | number | 30000 | 最大录音时长(毫秒) | | heartbeatIntervalMs | number | 30000 | 连接健康检查间隔 | | autoJoinChannel | string | undefined | 启动时自动加入的频道 ID |

提供商配置

OpenAI(Whisper + TTS)

json5
{
openai: {
apiKey: sk-...,
whisperModel: whisper-1,
ttsModel: tts-1,
},
}

ElevenLabs(仅 TTS)

json5
{
elevenlabs: {
apiKey: ...,
voiceId: 21m00Tcm4TlvDq8ikWAM, // Rachel
modelId: elevenmultilingualv2,
},
}

Deepgram(仅 STT)

json5
{
deepgram: {
apiKey: ...,
model: nova-2,
},
}

使用方法

斜杠命令(Discord)

在 Discord 中注册后,使用以下命令:

  • - /discordvoice join - 加入语音频道
  • /discordvoice leave - 离开当前语音频道
  • /discord_voice status - 显示语音连接状态

CLI 命令

bash

加入语音频道


clawdbot discord_voice join

离开语音频道

clawdbot discord_voice leave --guild

检查状态

clawdbot discord_voice status

代理工具

代理可以使用 discord_voice 工具:

加入语音频道 1234567890

该工具支持以下操作:

  • - join - 加入语音频道(需要 channelId)
  • leave - 离开语音频道
  • speak - 在语音频道中说话
  • status - 获取当前语音状态

工作原理

  1. 1. 加入:机器人加入指定的语音频道
  2. 监听:VAD 检测用户何时开始/停止说话
  3. 录制:用户说话时缓冲音频
  4. 转录:检测到静音后,音频发送至 STT 提供商
  5. 处理:转录文本发送至 Clawdbot 代理
  6. 合成:代理响应通过 TTS 转换为音频
  7. 播放:在语音频道中播放音频

流式 STT(Deepgram)

使用 Deepgram 作为 STT 提供商时,默认启用流式模式。这提供了:

  • - 端到端延迟降低约 1 秒
  • 实时反馈,包含中间转录结果
  • 自动保活,防止连接超时
  • 回退机制,流式传输失败时使用批量转录

使用流式 STT:

json5
{
sttProvider: deepgram,
streamingSTT: true, // 默认值
deepgram: {
apiKey: ...,
model: nova-2,
},
}

打断支持

启用时(默认),如果用户开始说话,机器人会立即停止播放。这创造了更自然的对话流程,允许你打断机器人。

禁用(让机器人说完):

json5
{
bargeIn: false,
}

自动重连

插件包含自动连接健康监测:

  • - 每 30 秒心跳检查(可配置)
  • 断开时自动重连,采用指数退避策略
  • 最多 3 次尝试,之后放弃

如果连接断开,你会看到类似日志:

[discord-voice] 与语音频道断开连接
[discord-voice] 重连尝试 1/3
[discord-voice] 重连成功

VAD 灵敏度

  • - low:捕捉轻声说话,可能触发背景噪音
  • medium:平衡(推荐)
  • high:需要更响亮、更清晰的语音

故障排除

Discord 客户端不可用

确保 Discord 频道已配置,且机器人在使用语音前已连接。

Opus/Sodium 构建错误

安装构建工具:

bash
npm install -g node-gyp
npm rebuild @discordjs/opus sodium-native

听不到音频

  1. 1. 检查机器人是否拥有连接 + 说话权限
  2. 检查机器人是否被服务器静音
  3. 验证 TTS API 密钥是否有效

转录不工作

  1. 1. 检查 STT API

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 discord-voice-1776383226 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 discord-voice-1776383226 技能

通过命令行安装

skillhub install discord-voice-1776383226

下载

⬇ 下载 discord-voice v0.1.6(免费)

文件大小: 162.92 KB | 发布时间: 2026-4-17 15:13

v0.1.6 最新 2026-4-17 15:13
discord-voice 0.1.6

- No code or documentation changes detected in this version.
- Functionality and configuration remain identical to the previous release.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部