返回顶部
v

video-subtitle-skill视频字幕生成

为视频/音频自动生成字幕,支持多语言识别、翻译、说话人分离、字幕烧入视频

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
268
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

video-subtitle-skill

视频字幕生成器 (Video Subtitle Generator)

基于 SenseAudio ASR API,为视频或音频文件自动生成字幕。

核心功能

  1. 1. 语音识别 — 自动识别视频/音频中的语音内容,生成带时间戳的字幕
  2. 多语言支持 — 支持中文、英文、日文、韩文等 20+ 种语言
  3. 字幕翻译 — 识别后可自动翻译成目标语言
  4. 说话人分离 — 多人对话场景自动区分不同说话人
  5. 字幕烧入 — 将生成的字幕直接烧入视频输出新文件
  6. 多格式输出 — 支持 SRT / VTT / TXT / JSON 格式

使用方式

用户说出类似以下请求时触发此 Skill:

  • - 帮我给这个视频加字幕
  • 识别这个音频的内容并生成字幕
  • 把这个英文视频翻译成中文字幕
  • 帮我总结一下这个视频讲了什么

执行步骤

第一步:检查 API 密钥

bash
echo SENSEAUDIOAPIKEY=$SENSEAUDIOAPIKEY

如果 SENSEAUDIOAPIKEY 为空,必须先向用户询问,说明在 https://senseaudio.cn 注册获取。不要直接运行脚本让它报错。

第二步:运行脚本生成字幕

bash

基础用法


python scripts/video_subtitle.py /path/to/video.mp4 --output outputs/

指定语言 + 翻译

python scripts/video_subtitle.py /path/to/video.mp4 --language zh --translate en

生成字幕并烧入视频

python scripts/video_subtitle.py /path/to/video.mp4 --burn --font-size 28

说话人分离

python scripts/video_subtitle.py /path/to/meeting.mp4 --model pro --speaker

注意:如果环境变量 SENSEAUDIOAPIKEY 已设置,无需 --senseaudio-api-key。

第三步:内容总结(如用户需要)

脚本会输出纯文本转写结果(*.txt)。如果用户需要视频内容总结,你(Claude)直接读取这个 txt 文件并总结,不需要调用外部 LLM。

第四步:返回结果

将生成的字幕文件路径(和烧入后的视频路径)返回给用户。

ASR 模型选择

模型参数值特点适用场景
极速版lite毫秒级响应、30+ 语言低成本批量转写
标准版
standard | 功能全面、性价比高 | 通用转写、视频字幕(推荐) | | 专业版 | pro | 高精度、说话人分离 | 会议记录、访谈、多人场景 | | 深度版 | deepthink | 智能纠错、方言增强 | 方言/术语较多的场景 |

环境要求

  • - Python 3.10+,依赖:requests
  • 系统依赖:ffmpeg(音频提取和字幕烧入)、fonts-noto-cjk(中日韩字幕烧入需要)
  • SENSEAUDIOAPIKEY — SenseAudio API 密钥(唯一需要的密钥)

参数说明

参数说明默认值
input输入视频/音频文件路径(必填)-
--output
输出目录 | 输入文件同级 subtitle_output/ | | --model | ASR 模型 (lite/standard/pro/deepthink) | standard | | --language | 音频语言代码 (zh/en/ja 等) | 自动检测 | | --translate | 翻译目标语言代码 | 不翻译 | | --speaker | 启用说话人分离 | 否 | | --sentiment | 启用情感分析 | 否 | | --burn | 将字幕烧入视频 | 否 | | --font-size | 烧入字幕字体大小 | 24 | | --format | 字幕格式 (srt/vtt/both) | srt | | --senseaudio-api-key | SenseAudio API 密钥 | 环境变量 |

输出文件

文件说明
文件名.srtSRT 格式字幕
文件名.vtt
VTT 格式字幕(需指定 --format vtt/both) | | 文件名.txt | 纯文本转写结果 | | 文件名_detail.json | 详细识别结果(含时间戳、说话人等) | | 文件名_subtitled.mp4 | 烧入字幕的视频(需指定 --burn) |

支持的语言代码

zh(中文) en(英文) ja(日文) ko(韩文) fr(法语) de(德语) es(西班牙语) pt(葡萄牙语) ru(俄语) it(意大利语) ar(阿拉伯语) yue(粤语) nl(荷兰语) id(印尼语) ms(马来语) th(泰语) tr(土耳其语) vi(越南语) 等

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 video-subtitle-skill-1776303421 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 video-subtitle-skill-1776303421 技能

通过命令行安装

skillhub install video-subtitle-skill-1776303421

下载

⬇ 下载 video-subtitle-skill v1.0.0(免费)

文件大小: 12.75 KB | 发布时间: 2026-4-17 16:29

v1.0.0 最新 2026-4-17 16:29
video-subtitle-skill v1.0.0

- 首次发布:基于 SenseAudio ASR API 的自动视频/音频字幕生成工具
- 支持多语言识别、字幕翻译、说话人分离、字幕烧入视频
- 多种字幕输出格式:SRT / VTT / TXT / JSON
- 提供详细使用文档及常见参数说明
- 使用环境 API 密钥验证,明确指引获取方法

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部