返回顶部
f

feishu-voice飞书语音

Send and receive voice messages on Feishu (Lark) using ElevenLabs TTS and STT. Activate when user asks to send a voice message on Feishu, or when receiving a Feishu audio message (media attachment with .ogg/.opus file) that needs transcription. Supports smart reply mode — auto voice-reply to voice messages, text-reply to text messages.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.0
安全检测
已通过
443
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

feishu-voice

飞书语音(TTS + STT)

使用ElevenLabs在飞书上发送语音消息并转录接收到的语音消息。

前置条件

  • - sag CLI(ElevenLabs TTS):npm i -g sag 或 go install
  • ffmpeg / ffprobe:brew install ffmpeg
  • ElevenLabs付费套餐(使用语音库需要)
  • 已授权im:message:sendasbot和im:file权限的飞书应用

环境变量

变量必需说明
ELEVENLABSAPIKEYElevenLabs API密钥
FEISHUAPPID
✅(TTS) | 飞书应用ID | | FEISHUAPPSECRET | ✅(TTS) | 飞书应用密钥 | | ELEVENLABSVOICEID | ✅(TTS) | 语音ID(在elevenlabs.io/voice-library浏览) | | ELEVENLABSMODELID | ✅(TTS) | 模型ID(例如elevenmultilingualv2、eleven_v3) | | ELEVENLABS_SPEED | ❌ | 语速 0.5-2.0(默认:1.0) |

如果环境中未设置FEISHUAPPID/FEISHUAPPSECRET,可从openclaw配置中提取:

bash
export FEISHUAPPID=$(python3 -c import json; print(json.load(open($HOME/.openclaw/openclaw.json))[channels][feishu][appId]))
export FEISHUAPPSECRET=$(python3 -c import json; print(json.load(open($HOME/.openclaw/openclaw.json))[channels][feishu][appSecret]))

语音选择

查看config/voice-config.example.json获取精选语音列表。浏览所有语音请访问https://elevenlabs.io/voice-library或运行sag voices。

推荐模型:

  • - elevenmultilingualv2 — 最适合中文和多语言内容
  • eleven_v3 — 最新的英语优化模型

发送语音消息(TTS)

bash
scripts/feishu-voice-send.sh <文本> <接收者ID> [接收者ID类型] [语速]

  • - receiveid:目标用户的openid或群聊的chatid
  • receiveidtype:openid(默认)或chat_id
  • speed:语速倍数,0.5-2.0(默认:1.0)

接收语音消息(STT)

当OpenClaw传递飞书语音消息时,会以媒体附件(.ogg文件)形式到达。使用以下命令进行转录:

bash
scripts/feishu-voice-stt.sh /path/to/audio.ogg

将识别出的文本输出到标准输出。使用ElevenLabs scribe_v1模型,支持自动语言检测。

备用方案:通过飞书API下载

如果音频文件未作为附件传递(仅有file_key可用):

  1. 1. 列出最近消息:GET /im/v1/messages?containeridtype=chat&containerid=CHATID&pagesize=5&sorttype=ByCreateTimeDesc
  2. 下载音频:GET /im/v1/messages/{messageid}/resources/{filekey}?type=file
  3. 对下载的文件运行STT脚本

智能回复模式

接收消息时,遵循以下模式进行自然对话:

  • - 收到语音消息 → 使用STT转录 → 理解 → 使用语音回复(TTS)
  • 收到文本消息 → 理解 → 使用文本回复
  • 覆盖模式:用户可以明确要求语音或文本回复

重要说明

  • - 飞书msgtype必须为audio — 而非media或file
  • OpenClaw的message工具的asVoice功能在飞书上无法正常工作 — 请改用此脚本
  • STT使用ElevenLabs scribev1模型,支持中文、英文及90多种语言
  • 免费版ElevenLabs账户仅支持预制语音;语音库需要付费套餐

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 feishu-voice-elevenlabs-1776282713 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 feishu-voice-elevenlabs-1776282713 技能

通过命令行安装

skillhub install feishu-voice-elevenlabs-1776282713

下载

⬇ 下载 feishu-voice v1.1.0(免费)

文件大小: 4.74 KB | 发布时间: 2026-4-16 17:48

v1.1.0 最新 2026-4-16 17:48
v1.1.0: Added speed control, voice config example, smart reply mode guidance

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部