返回顶部
a

audio-srt-workflow音频字幕工作流

Generate or align SRT subtitles from audio using this repository. Use when the user asks for subtitle generation, transcript-to-audio alignment, timing cleanup, SRT quality checks, or subtitle preview video rendering.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.2
安全检测
已通过
99
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

audio-srt-workflow

音频字幕工作流

使用此技能进行端到端的字幕处理。

本包为运行时入口点提供自包含内容:

  • - scripts/aligntosrt.py
  • scripts/guiapp.py
  • scripts/srtstats.py
  • scripts/makepreviewmp4.py
  • scripts/requirements.txt

适用范围

  • - 模式A:音频 + 参考文本 → 对齐后的SRT字幕
  • 模式B:仅音频 → 自动生成SRT字幕
  • 使用 srtstats.py 进行时间轴质量检查
  • 使用 makepreview_mp4.py 生成带字幕的预览视频

需首先收集的输入

  1. 1. 音频路径(wav、mp3、m4a 等)
  2. 是否有参考转录文本
  3. 输出SRT路径(或输出目录)
  4. 语言提示(zh、en 等)
  5. 首选运行方式:CLI、GUI 或 Python API

决策规则

  • - 如果有转录文本,运行模式A(aligntosrt.py --text ...)。
  • 如果没有转录文本,通过GUI或Python API运行模式B(runautosubtitle_pipeline)。

工作流程

  1. 1. 验证环境和路径。
  2. 根据转录文本可用性选择模式A或模式B。
  3. 通过打包脚本运行字幕生成。
  4. 运行时间轴诊断(srt_stats.py)。
  5. 如果需要,渲染带烧录字幕的预览mp4文件。

解析技能脚本路径

设置一个本地变量指向已安装的技能目录。

Codex默认路径:

bash
SKILLDIR=${CODEXHOME:-$HOME/.codex}/skills/audio-srt-workflow

OpenClaw/ClawHub安装路径示例:

bash
SKILL_DIR=<你的工作目录>/skills/audio-srt-workflow

环境检查

执行前运行以下检查:

bash
python3 --version
ffmpeg -version
python3 -c import faster_whisper; print(ok)

如果 faster-whisper 导入失败:

bash

安装前检查依赖:


cat $SKILL_DIR/scripts/requirements.txt
pip install -r $SKILL_DIR/scripts/requirements.txt

模式A命令模板(音频 + 转录文本)

bash
python3 $SKILLDIR/scripts/alignto_srt.py \
--audio <输入音频> \
--text <转录文本> \
--output <输出SRT> \
--model small \
--language zh

模式B命令模板(仅音频)

GUI:

bash
python3 $SKILLDIR/scripts/guiapp.py

或在脚本中使用Python API:

  • - 使用 buildalignmentconfig(...) 构建配置
  • 运行 runautosubtitle_pipeline(...)

详见 references/command-templates.md 中的命令详情。

质量检查与预览

时间轴统计:

bash
python3 $SKILLDIR/scripts/srtstats.py --srt <输出SRT>

预览视频:

bash
python3 $SKILLDIR/scripts/makepreview_mp4.py \
--audio <输入音频> \
--srt <输出SRT> \
--output <预览MP4>

输出规范

  • - 默认输出使用 .srt 扩展名。
  • 批量运行时建议使用带日期的命名(例如 output_YYYYMMDD.srt)。
  • 中间检查文件与最终交付文件分开存放。

注意事项

  • - 对于中文输出(zh),流程仅去除逗号和句号。
  • 如果时间轴不准确,在更改模型大小前先检查波形快照相关参数。
  • 此技能需要显式调用(allowimplicitinvocation: false)。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 audio-srt-workflow-1775915601 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 audio-srt-workflow-1775915601 技能

通过命令行安装

skillhub install audio-srt-workflow-1775915601

下载

⬇ 下载 audio-srt-workflow v0.1.2(免费)

文件大小: 23.3 KB | 发布时间: 2026-4-12 09:04

v0.1.2 最新 2026-4-12 09:04
Security hardening: require explicit invocation, pin faster-whisper version, and add dependency-review step before install.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部