返回顶部
s

subtitle-video-generator字幕视频生成器

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.5
安全检测
已通过
225
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

subtitle-video-generator

字幕视频生成器 — 每种语言。每种风格。每个平台。一次上传。

字幕已成为视频内容与全球观众之间的通用界面。它们同时发挥四种不同功能:无障碍性(让听障人士能够使用内容)、参与度(吸引85%在社交媒体上静音观看的用户)、覆盖范围(将内容翻译给50多种语言的受众)以及可发现性(提供搜索引擎可索引的文本)。每一项功能都足以证明为每个视频添加字幕的合理性。综合来看,字幕是任何视频内容后期制作中投资回报率最高的附加项。自动生成的平台字幕与专业字幕之间的质量差距,正是NemoVideo填补的空间。平台自动字幕的准确率为80-85%——每15-20个单词出现一个错误,观众可见且损害可信度。专业人工字幕的准确率可达99%以上,每视频分钟收费3-8美元,周转时间24-48小时。NemoVideo提供98%以上的准确率,具备单词级时间轴、完整样式自定义、多语言翻译、说话人区分和即时周转。以往需要专业字幕服务才能达到的质量,现在以现代内容生产所需的速度和规模交付。

使用场景

  1. 1. 社交媒体字幕 — 参与度优化样式(15-90秒) — 面向TikTok、Instagram Reels和YouTube Shorts的短视频内容需要最大化观看时长的动画字幕样式。NemoVideo:以单词级时间轴精度进行转录,应用平台原生动画样式(大号粗体文字、创作者品牌色的逐词高亮动画、高对比度轮廓确保可读性),定位在特定平台的安全区域内(TikTok:底部15%以上;Reels:底部20%以上、顶部10%以下;Shorts:底部10%以上),并导出字幕直接渲染到视频中的文件(对于字幕上传受限或不可靠的平台至关重要)。这种字幕样式已被证明可将短视频完播率提高15-25%。
  1. 2. 企业多语言 — 全球传播(任意时长) — 企业制作的视频内容需要覆盖15个以上国家的员工和客户。NemoVideo:转录源语言,使用上下文感知AI翻译至所有目标语言(理解企业术语、产品名称和行业行话),按语言调整字幕时间轴(为需要更多词句的语言扩展,为使用较少词句的语言收缩),处理阿拉伯语和希伯来语的双向文本(正确的RTL渲染和换行),在所有语言中应用一致的企业字幕样式(品牌字体、颜色、定位),并导出与公司视频托管基础设施兼容的字幕文件(大多数平台用SRT,网页用VTT,广播用TTML)。一个视频,全球覆盖,一致的品牌质量。
  1. 3. 教育字幕 — 学习优化显示(任意时长) — 教育内容需要为理解而非娱乐优化的字幕:复杂材料的较慢阅读速度、技术术语高亮显示以及多人讨论的清晰说话人识别。NemoVideo:根据内容复杂度调整阅读速度(密集技术内容14字符/秒 vs. 对话片段18字符/秒),可选择在首次出现时高亮技术词汇(对可能不熟悉的术语使用粗体或不同颜色),通过持续的颜色区分识别说话人(对小组讨论和多讲师课程至关重要),保持句子感知的换行(绝不将短语跨行拆分以致影响理解),并生成符合WCAG 2.1 AA标准的字幕以满足机构无障碍要求。服务于学习而非仅仅消费的字幕。
  1. 4. 电影和纪录片 — 广播标准字幕(任意时长) — 独立电影制作人和纪录片制片人需要符合广播和电影节技术规范的字幕。NemoVideo:生成符合广播标准的字幕(最多2行,每行最多42个字符,最短显示时间1秒,阅读速度15-17字符/秒),应用专业定位(底部居中,当屏幕文字或图形可能被遮挡时垂直偏移),处理复杂的音频场景(重叠对话、带歌词的音乐、背景对话、需要为无障碍性描述的音效),创建开放式字幕(为电影节放映嵌入视频)和封闭式字幕(为广播分发作为单独文件),并导出行业标准格式(SRT、STL、EBU-TT、TTML、DFXP)。符合电影节提交和广播标准的字幕。
  1. 5. 批量库字幕 — 为整个目录加装字幕(多个视频) — 包含200+视频的内容库在缺乏一致字幕的情况下不断增长。有些有自动生成的字幕,有些完全没有,且均无翻译。NemoVideo:以一致的字幕样式批量处理整个库(所有视频使用相同字体、颜色、位置、动画),自动检测每个视频的口语语言(处理多语言库),以98%以上的准确率转录或重新转录每个视频(替换不准确的现有自动字幕),为整个库生成指定目标语言的翻译,并为每个视频生成嵌入字幕的视频文件和独立字幕文件。一个字幕不一致的库变成了专业字幕目录。

工作原理

第1步 — 上传视频

任何包含语音的视频,不限语言。单个视频或批量上传。NemoVideo自动检测语言和说话人数量。

第2步 — 配置字幕输出

样式(动画、广播、简约、自定义)、语言(源语言+翻译目标)、定位、说话人区分和导出格式。

第3步 — 生成

bash curl -X POST https://mega-api-prod.nemovideo.ai/api/v1/generate \ -H Authorization: Bearer $NEMO_TOKEN \ -H Content-Type: application/json \ -d { skill: subtitle-video-generator, prompt: 为一段15分钟的双人采访生成专业字幕。英语源语言——翻译为西班牙语、法语和普通话。样式:简洁广播(白色文字、半透明深色背景条、最多2行)。说话人区分:采访者白色,嘉宾浅黄色。单词级时间轴。定位:底部居中,在出现下方三分之一图形时向上偏移。导出:每种语言16:9嵌入MP4 + 全部4种语言的独立SRT文件 + 一个带TikTok动画样式的9:16英语版用于社交片段。, source_language: en, translations: [es, fr, zh], style: { preset: broadcast-clean, background: semi-transparent-dark, max_lines: 2, timing: word-level }, speakers: { differentiate: true, interviewer: #FFFFFF, guest: #FFFACD }, position: {base: bottom-center, avoidlowerthirds: true}, exports: { embedded_16x9: [en, es, fr, zh], srt_files: [en, es, fr, zh], social_9x16: {language: en, style: tiktok-animated} } }

第4步 — 检查准确性和时间轴

播放每种语言版本。验证:转录准确性(尤其是姓名、技术术语、数字)、时间轴同步、说话人识别正确性、翻译自然度和换行逻辑。编辑并重新渲染任何更正。

参数

参数类型必填描述
prompt字符串字幕生成要求
source_language
字符串 | | 源音频语言(省略时自动检测) | | translations | 数组 | | 目标语言 [es, fr, zh, ...] | | style | 对象 | | {预设, 字体, 颜色, 背景, 最大行数, 动画, 时间轴} | | speakers | 对象 | | {区分, 按角色颜色} | | position | 对象 | | {基准, 偏移, 避开图形} | | reading_speed | 字符串 | | 教育慢速, 标准, 快速 | | broadcast_compliance | 布尔值 | | 应用广播字幕标准 | | accessibility | 字符串 | | wcag-aa, wcag-aaa | | exports | 对象 | | {嵌入, srt文件, vtt文件, 社交} | | batch | 布尔值 | | 处理多个视频 |

输出示例

json
{
job_id: subgen-20260329-001,
status: completed,
source_language: en,
confidence: 0.986,
speakers: 2,
word_count: 3240,
languages: [en, es, fr, zh],
outputs: {
embedded: {
en: {file: interview-sub-en-16x9.mp4},
es: {file: interview-sub-es-16x9.mp4},
fr: {file: interview-sub-fr-16x9.mp4},
zh: {file: interview-sub-zh-16x9.mp4}
},
srt_files: [interview-en.srt, interview

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 subtitle-video-generator-1776017401 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 subtitle-video-generator-1776017401 技能

通过命令行安装

skillhub install subtitle-video-generator-1776017401

下载

⬇ 下载 subtitle-video-generator v1.0.5(免费)

文件大小: 5.75 KB | 发布时间: 2026-4-13 12:12

v1.0.5 最新 2026-4-13 12:12
**Expanded feature set and improved documentation in this update.**

- Updated the SKILL.md with a comprehensive product description, detailing all core features, batch processing, export options, and technical standards supported.
- Added targeted use cases for social media, corporate comms, educational, film/broadcast, and batch subtitle workflows.
- Clarified subtitle styling options: animated (TikTok/Shorts), corporate, educational, professional broadcast, and accessibility compliance.
- Enhanced instructions on language support, multi-speaker differentiation, word-level timing, and export file formats.
- Improved marketing copy and SEO phrases in the description.
- No functional or behavior changes to the codebase—SKILL.md documentation only.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部