返回顶部
d

douyin-transcriber抖音语音转录

Audio/video transcription module using Docker Whisper ASR. Extract speech from audio or video files and convert to text. Use when: (1) Transcribing audio files (mp3, wav, m4a, etc.), (2) Transcribing video files (mp4, mkv, etc.), (3) Need speech-to-text for any media file, (4) Working with douyin/tiktok video transcription workflows. Supports automatic audio extraction, format conversion, and multiple Whisper models.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.5
安全检测
已通过
105
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

douyin-transcriber

Douyin 转录器

使用本地 Docker Whisper ASR 将音频/视频文件转录为文本。

快速开始

bash
curl -X POST http://localhost:PORT/asr -F audio_file=@/path/to/video.mp4

该容器内置了 ffmpeg,可自动提取音频。

前提条件

工具用途安装方式
DockerWhisper ASRDocker Desktop
ffmpeg
音频提取 | winget install Gyan.FFmpeg |

部署 Whisper ASR:
bash
docker run -d -p PORT:PORT -e ASRMODEL=small -e ASRENGINE=faster_whisper --name whisper-asr onerahmet/openai-whisper-asr-webservice:latest

工作流程

步骤 1:从视频中提取音频

bash
ffmpeg -i video.mp4 -ar 16000 -ac 1 -c:a pcm_s16le audio.wav -y

参数说明:

  • - -ar 16000:16kHz 采样率
  • -ac 1:单声道
  • -c:a pcm_s16le:16位 PCM 编码

步骤 2:转录

bash
curl -X POST http://localhost:PORT/asr -F audio_file=@audio.wav

可选:指定语言
bash
curl -X POST http://localhost:PORT/asr -F audio_file=@audio.wav -F language=zh

步骤 3:解析结果

响应格式:
json
{
text: 转录内容...,
segments: [
{start: 0.0, end: 2.5, text: 第一句话},
{start: 2.5, end: 5.0, text: 第二句话}
],
language: zh
}

模型选择

模型大小5分钟视频处理时间准确度
tiny75MB~30秒一般
base
142MB | ~1分钟 | 良好 | | small | 466MB | ~3分钟 | 较好(推荐) | | medium | 1.5GB | ~8分钟 | 最佳 |

通过环境变量更改模型:-e ASR_MODEL=medium

支持的格式

视频: mp4、mkv、avi、mov、flv、wmv、webm、m4v

音频: wav、m4a、mp3、aac、ogg、flac、wma、opus

故障排除

问题解决方案
Docker 不可用安装 Docker Desktop
容器启动失败
检查端口可用性 | | 转录超时 | 使用更小的模型或分割音频 | | 找不到 ffmpeg | winget install Gyan.FFmpeg |

相关模块

  • - douyin-fetcher - 视频下载
  • douyin-analyzer - 内容分析
  • douyin-orchestrator - 工作流协调

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 douyin-transcriber-1775899935 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 douyin-transcriber-1775899935 技能

通过命令行安装

skillhub install douyin-transcriber-1775899935

下载

⬇ 下载 douyin-transcriber v1.0.5(免费)

文件大小: 1.89 KB | 发布时间: 2026-4-12 09:46

v1.0.5 最新 2026-4-12 09:46
- Added clear usage instructions and workflow for audio/video transcription using Docker Whisper ASR.
- Detailed prerequisite tools and installation steps.
- Included command examples for extracting audio, transcribing, specifying language, and parsing results.
- Provided table for model selection, supported formats, and troubleshooting common issues.
- Listed related modules for extended Douyin/TikTok workflows.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部