返回顶部
e

elevenlabs-transcribeElevenLabs语音转文字

Transcribe audio to text using ElevenLabs Scribe. Supports batch transcription, realtime streaming from URLs, microphone input, and local files.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
2,502
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

elevenlabs-transcribe

ElevenLabs 语音转文本

ElevenLabs官方语音转文本技能。

以业界领先的准确度将音频转换为文本。支持90多种语言、说话人分离和实时流式传输。

前置条件

  • - 已安装 ffmpeg(macOS上使用 brew install ffmpeg)
  • 已设置 ELEVENLABSAPIKEY 环境变量
  • Python 3.8+(首次运行时自动安装依赖)

使用方法

bash
{baseDir}/scripts/transcribe.sh <音频文件> [选项]
{baseDir}/scripts/transcribe.sh --url <流地址> [选项]
{baseDir}/scripts/transcribe.sh --mic [选项]

示例

批量转录

转录本地音频文件:

bash
{baseDir}/scripts/transcribe.sh recording.mp3

带说话人识别:

bash
{baseDir}/scripts/transcribe.sh meeting.mp3 --diarize

获取带时间戳的完整JSON响应:

bash
{baseDir}/scripts/transcribe.sh interview.wav --diarize --json

实时流式传输

从URL流式传输(例如:直播电台、播客):

bash
{baseDir}/scripts/transcribe.sh --url https://npr-ice.streamguys1.com/live.mp3

从麦克风转录:

bash
{baseDir}/scripts/transcribe.sh --mic

实时流式传输本地文件(适用于测试):

bash
{baseDir}/scripts/transcribe.sh audio.mp3 --realtime

静默模式(适用于代理)

抑制stderr上的状态消息:

bash
{baseDir}/scripts/transcribe.sh --mic --quiet

选项

选项描述
--diarize识别音频中的不同说话人
--lang CODE
ISO语言提示(例如:en、pt、es、fr) | | --json | 输出带时间戳和元数据的完整JSON | | --events | 标记音频事件(笑声、音乐、掌声) | | --realtime | 流式传输本地文件而非批量处理 | | --partials | 在实时模式下显示中间转录结果 | | -q, --quiet | 抑制状态消息(推荐用于代理) |

输出格式

文本模式(默认)

纯文本转录:

敏捷的棕色狐狸跳过了懒狗。

JSON模式(--json)

json
{
text: 敏捷的棕色狐狸跳过了懒狗。,
language_code: eng,
language_probability: 0.98,
words: [
{text: The, start: 0.0, end: 0.15, type: word, speakerid: speaker0}
]
}

实时模式

最终转录结果在提交时打印。使用--partials:

[partial] 敏捷的棕色
[partial] 敏捷的棕色狐狸
敏捷的棕色狐狸跳过了懒狗。

支持的格式

音频: MP3、WAV、M4A、FLAC、OGG、WebM、AAC、AIFF、Opus
视频: MP4、AVI、MKV、MOV、WMV、FLV、WebM、MPEG、3GPP

限制: 最大文件大小3GB,最长时长10小时

错误处理

脚本在出错时以非零状态退出:

  • - 缺少API密钥: 设置 ELEVENLABSAPIKEY 环境变量
  • 文件未找到: 检查文件路径是否存在
  • 缺少ffmpeg: 使用包管理器安装
  • API错误: 检查API密钥有效性和速率限制

何时使用每种模式

场景命令
转录录音./transcribe.sh file.mp3
多人会议
./transcribe.sh meeting.mp3 --diarize | | 直播电台/播客流 | ./transcribe.sh --url | | 用户语音输入 | ./transcribe.sh --mic --quiet | | 需要单词时间戳 | ./transcribe.sh file.mp3 --json |

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 elevenlabs-transcribe-1776367648 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 elevenlabs-transcribe-1776367648 技能

通过命令行安装

skillhub install elevenlabs-transcribe-1776367648

下载

⬇ 下载 elevenlabs-transcribe v1.0.1(免费)

文件大小: 7.34 KB | 发布时间: 2026-4-17 14:22

v1.0.1 最新 2026-4-17 14:22
- Updated script and file locations to the new scripts/ directory for better organization.
- Usage examples and documentation now reference {baseDir}/scripts/transcribe.sh.
- requirements.txt, transcribe.py, and transcribe.sh moved into scripts/ directory.
- Old top-level script and requirement files removed; new versions added in scripts/.
- No changes to user-facing options or functionality.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部