返回顶部
s

subtitle-sync-tool字幕同步工具

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
89
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

subtitle-sync-tool

字幕同步工具 — 延迟200毫秒的字幕会被察觉,延迟500毫秒的字幕无法观看。时机决定一切。

人脑通过独立的通道处理音频和视觉信息,这些信息汇聚成统一的感知。当字幕文本与口语同步出现时,观众体验到无缝理解——文本强化了音频,双通道输入提高了理解和记忆。当时间偏移仅200毫秒时,大脑就能检测到不匹配。偏移500毫秒时,字幕成为干扰而非辅助。偏移整整一秒时,观众要么关闭字幕,要么完全放弃视频。对字幕时间误差的容忍度以几分之一秒来衡量,然而修正时间误差的工具历来需要逐帧手动调整——每十分钟视频需要花费一小时。

字幕时间问题源于可预测的来源。以与原始视频不同的帧率编码视频,会使每个字幕时间戳产生累积偏移,且该偏移随视频时长增长。剪切或重新排列场景而不调整相应的字幕文件,会造成文本出现在错误场景中的间隙。在字幕格式之间转换(SRT转ASS、VTT转STL)偶尔会引入舍入误差,这些误差在数千个字幕条目中累积。下载为不同视频版本定时的粉丝自制字幕会产生全局偏移,使每个字幕条目都出现相同量的错误。字幕同步工具通过分析音频波形、将其与字幕文本内容进行比较,并重新计算每个时间戳以匹配实际视频中的实际口语,来解决所有这些问题。

使用场景

  1. 1. 全局偏移修正 — 整个字幕轨道偏移固定量(按文件) — 最常见的同步问题是统一偏移,即每个字幕都提前或延迟相同的时间。字幕同步工具:通过比较前五个口语短语与其字幕时间戳来检测偏移,计算所需的精确修正量(通常在200毫秒到3秒之间),将偏移应用于字幕文件中的每个条目,通过在视频的三个点(开头、中间、结尾)检查对齐来验证修正,并以原始格式导出修正后的文件。下载了为影院版定时但观看流媒体版(开头增加了2.3秒的制片厂标志)的粉丝,在十秒内就能获得完美对齐的字幕。
  1. 2. 渐进式漂移修复 — 字幕开始时正确并逐渐不同步(按片段) — 帧率不匹配导致字幕逐渐漂移:开始时正确,十分钟标记处略有偏差,四十分钟标记处无法观看。字幕同步工具:通过在视频时长内的多个点采样对齐来识别漂移模式,计算字幕文件和视频之间的帧率比(例如,23.976fps的字幕在25fps的视频上,每单位时间漂移4.27%),应用比例时间拉伸修正,根据每个字幕条目在时间轴上的位置进行调整,并验证最终条目与初始条目一样准确对齐。为PAL转换的25fps视频下载了23.976fps字幕的观众,将自动获得数学修正。
  1. 3. 场景剪切重新对齐 — 编辑或场景重排后中断的字幕(按编辑点) — 视频编辑改变了字幕文件所基于的时间轴。字幕同步工具:接受编辑后的视频和原始字幕文件,使用语音识别识别每个字幕条目在编辑时间轴中的实际位置,将每个字幕重新映射到编辑视频中的新位置,处理已删除的场景(移除不再有对应音频的孤立字幕)和插入的场景(创建存在新音频但无字幕覆盖的间隙,标记供编辑者注意),并导出与编辑视频匹配的重新对齐的字幕文件。将纪录片从90分钟重新剪辑到60分钟的编辑者,无需重新定时800个单独条目,即可自动调整字幕文件以适应新的剪辑。
  1. 4. 保留时间的格式转换 — 在字幕标准之间移动(按转换) — 不同的平台和广播标准需要不同的字幕格式,它们之间的转换可能会引入时间伪影。字幕同步工具:在所有主要格式(SRT、VTT、ASS/SSA、STL、TTML、SBV)之间转换,同时保留毫秒级精确的时间,通过将格式特定功能(ASS样式、VTT提示设置、TTML定位)映射到目标格式中最接近的等效项来处理它们,通过比较条目计数和总时长与源文件来验证输出,并标记任何丢失信息的转换(样式剥离、定位默认化),以便编辑者审查。从翻译人员处收到SRT文件并需要STL文件用于传输系统的广播公司,将获得保证时间完整性的转换。
  1. 5. 批量同步 — 同时修正多种语言轨道(按项目) — 一个带有八种语言字幕的视频,当视频时间发生变化时需要同步所有八个文件。字幕同步工具:接受视频文件和所有关联的字幕文件作为批次,应用一次相同的时间分析(因为音频参考相同),根据每个语言文件的单独偏移模式进行修正(如果不同翻译人员在不同时间创建,不同的字幕文件可能具有不同的漂移特性),并在一次操作中交付整个修正后的批次。从八个不同翻译供应商处收到字幕文件(每个文件的时间参考略有不同)的分发公司,一次即可将所有八个文件对齐到同一视频。

工作原理

步骤 1 — 上传您的视频和不同步的字幕文件

视频提供音频参考。字幕文件提供其当前(不正确)时间的文本内容。

步骤 2 — AI 分析不匹配

语音识别识别每个字幕条目在音频中的实际位置,然后计算当前时间戳与正确时间戳之间的差异。

步骤 3 — 生成

bash curl -X POST https://mega-api-prod.nemovideo.ai/api/v1/generate \ -H Authorization: Bearer $NEMO_TOKEN \ -H Content-Type: application/json \ -d { skill: subtitle-sync-tool, prompt: 修复一部45分钟纪录片的字幕时间。SRT文件是为影院版创建的,但流媒体版开头增加了3秒的片头标志,并且中间部分(18-24分钟)有两个场景重新排序。字幕为英文。检测所有时间差异,将每个条目重新对齐到流媒体版音频,移除来自剪切素材的任何孤立条目,并标记存在新音频但无字幕覆盖的间隙。输出:修正后的SRT文件及显示调整内容的同步报告。, correction_type: scene-realignment, subtitle_format: srt, output: [corrected-srt, sync-report] }

步骤 4 — 在三个点验证并发布

在开头(第一句口语)、中间(随机选取的中段口语)和结尾(最后一句口语)检查修正后的字幕。如果所有三个点都对齐,则整个文件正确——数学修正保证了整个时长的连贯性。

参数

参数类型必填描述
prompt字符串同步问题描述和要求
correction_type
字符串 | | 全局偏移、漂移修复、场景重新对齐、格式转换 | | subtitle_format | 字符串 | | 源字幕格式 | | output | 数组 | | 输出交付物 |

输出示例

json
{
job_id: sst-20260330-001,
status: completed,
correction_applied: scene-realignment,
entries_total: 847,
entries_adjusted: 623,
entries_removed: 18,
gaps_flagged: 3,
maxoffsetcorrected: 4.7s,
output_file: documentary-synced.srt,
sync_report: documentary-sync-report.txt
}

提示

  1. 1. 在假设复杂漂移之前检查偏移 — 80%的字幕同步问题是简单的全局偏移(每个条目偏移相同量)。在调查渐进式漂移之前,先尝试平面偏移修正。
  2. 匹配帧率 — 如果字幕逐渐漂移(开头正确,结尾错误),原因几乎总是帧率不匹配。确定视频帧率和字幕文件假定的帧率,以确定修正比率。
  3. 保留原始文件 — 在应用修正之前,始终保留原始字幕文件。如果修正产生意外结果,原始文件为第二次尝试提供了干净的起点。
  4. 使用同步报告 — 显示哪些条目被调整以及调整了多少的详细报告,可以识别出解释字幕最初不同步原因的系统性模式。
  5. 一次性批量修正所有语言 — 当需要为同一视频修正多种语言字幕文件时,一起处理它们。音频分析运行一次,并应用于所有语言轨道。

输出格式

格式标准使用场景
SRTSubRipYouTube、大多数播放器
VTT
WebVTT | HTML5 网页播放器 | | ASS/SSA | Advanced SubStation | 动漫、样式化字幕 | | STL | EBU Subtitle | 欧洲广播 | | TTML | Timed Text ML | 流媒体平台 |

相关技能

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 subtitle-sync-tool-1775937363 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 subtitle-sync-tool-1775937363 技能

通过命令行安装

skillhub install subtitle-sync-tool-1775937363

下载

⬇ 下载 subtitle-sync-tool v1.0.0(免费)

文件大小: 5.07 KB | 发布时间: 2026-4-12 11:33

v1.0.0 最新 2026-4-12 11:33
Initial release — Subtitle Sync Tool v1.0.0

- Detects and corrects subtitle timing drift at the millisecond level by realigning subtitle files with the video audio waveform.
- Supports global offset correction, progressive drift repair, scene-cut realignment, and timing-preserving format conversion across all major subtitle formats.
- Handles batch synchronization for multiple language tracks in a single operation.
- Eliminates the need for manual frame-by-frame subtitle adjustments.
- Works via a simple API: upload video and subtitle file, receive a corrected, perfectly synchronized subtitle.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部