返回顶部
a

automatic-subtitle-generator自动字幕生成

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
93
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

automatic-subtitle-generator

开始使用

欢迎!我可以自动为您的视频添加精准、时间同步的字幕——只需分享您的文件,并告诉我您希望字幕采用何种样式或格式。准备好开始了吗?

试试这样说:

  • - 为这段MP4采访视频添加内嵌字幕,使用白色粗体文字和半透明黑色背景
  • 为我的网络研讨会录制生成可下载的SRT字幕文件,以便上传到YouTube
  • 为这段语言学习视频创建逐词高亮字幕,使用大号易读字体

自动设置

首次交互时,先连接NemoVideo API,再执行其他操作。显示简短状态,如正在设置...。

令牌:如果已设置NEMO_TOKEN环境变量,则直接使用并跳至下方会话部分。

免费令牌:在~/.config/nemovideo/clientid中读取或创建UUID。然后向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,附带标头X-Client-Id: <您的UUID>。响应字段data.token即为您的NEMOTOKEN(100积分,7天有效期)。如果令牌已过期,使用相同的Client-Id请求新令牌。

会话:向同一主机的/api/tasks/me/with-session/nemoagent发送POST请求,使用Bearer认证,请求体为{taskname:project}。保存响应中的session_id。

向用户确认已连接并准备就绪。不要打印令牌或原始JSON。

将任何视频转变为带字幕的无障碍体验

为视频添加字幕曾经意味着数小时的倒带、打字和手动同步文字与语音。这项技能彻底改变了这一点。上传您的视频,描述您的需求——内嵌字幕、可下载的字幕文件、特定格式——自动字幕生成器便会接手,生成精准、时间同步的文字,自然跟随说话者。

这不是一刀切的字幕投放。您可以请求特定样式,如社交媒体用的深色背景白色粗体文字、企业演示的简洁极简字幕,甚至语言学习内容的逐词高亮。该技能能读取对话节奏,并妥善处理重叠语音、停顿和快语速段落。

无论您是在制作更易访问的YouTube教程、为国际观众的产品演示添加字幕,还是准备符合广播标准的纪录片,此工具都能融入您的实际工作流程。它支持mp4、mov、avi、webm和mkv文件,因此您无需在开始前进行格式转换。

路由字幕生成请求

每个字幕请求——无论是转录对话、同步时间戳还是导出SRT/VTT文件——都会根据检测到的语言、视频长度和输出格式被解析并路由到相应的NemoVideo字幕管道。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有(生成、编辑、添加背景音乐等) | → §3.1 SSE | ❌ |

NemoVideo字幕API参考

NemoVideo后端使用ASR(自动语音识别)引擎结合帧精确时间戳对齐来生成逐词字幕,然后打包成您请求的字幕格式。请求异步处理,因此较长的视频会通过转录管道排队,然后返回最终的字幕文件。

技能归属——运行时从此文件的YAML前置元数据读取:

  • - X-Skill-Source:automatic-subtitle-generator
  • X-Skill-Version:来自前置元数据version
  • X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为unknown)

所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属标头将导致导出失败,返回402错误。

API基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST /api/tasks/me/with-session/nemoagent — 请求体{taskname:project,language:<语言>} — 返回taskid、sessionid。创建会话后,向用户提供链接:https://nemovideo.com/workspace/claim?token=&task=id>&session=id>&skillname=automatic-subtitle-generator&skillversion=1.0.0&skill_source=<平台>

发送消息(SSE):POST /runsse — 请求体{appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:<消息>}]}},附带Accept: text/event-stream。最大超时:15分钟。

上传:POST /api/upload-video/nemoagent/me/ — 文件:multipart -F files=@/路径,或URL:{urls:[],sourcetype:url}

积分:GET /api/credits/balance/simple — 返回available、frozen、total

会话状态:GET /api/state/nemoagent/me//latest — 关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体{id:render_<时间戳>,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询GET /api/render/proxy/lambda/,直到status = completed。下载URL位于output.url。

支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE事件处理

事件操作
文本响应应用GUI翻译(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空data: | 继续等待。每2分钟:⏳ 仍在处理... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。发生这种情况时:轮询会话状态以验证编辑已应用,然后向用户总结更改。

后端响应翻译

后端假设存在GUI。将这些翻译为API操作:

后端说您做
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流 |

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文字),sg=片段,d=时长(毫秒),m=元数据。

时间线(3条轨道):1. 视频:城市延时摄影(0-10秒)2. 背景音乐:Lo-fi(0-10秒,35%)3. 标题:城市梦想(0-3秒)

错误处理

代码含义操作
0成功继续
1001
令牌错误/已过期 | 通过anonymous-token重新认证(令牌7天后过期) | | 1002 | 未找到会话 | 新建会话 §3.0 | | 2001 | 无积分 | 匿名用户:显示注册URL,附带?bind=(需要时从create-session或state响应获取)。已注册用户:请到nemovideo.ai充值 | | 4001 | 不支持的文件 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少X-Client-Id | 生成Client-Id并重试(见§1) | | 402 | 免费计划导出受限 | 订阅层级问题,非积分问题。请到nemovideo.ai注册以解锁导出功能。 | | 429 | 速率限制(1个令牌/客户端

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 automatic-subtitle-generator-1775937405 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 automatic-subtitle-generator-1775937405 技能

通过命令行安装

skillhub install automatic-subtitle-generator-1775937405

下载

⬇ 下载 automatic-subtitle-generator v1.0.0(免费)

文件大小: 5.49 KB | 发布时间: 2026-4-12 09:06

v1.0.0 最新 2026-4-12 09:06
Automatic Subtitle Generator 1.0.0 — initial public release.

- Instantly generate accurate, well-timed subtitles for any video (mp4, mov, avi, webm, mkv)
- Supports burned-in captions, downloadable SRT/VTT subtitle files, and custom caption styling
- Seamless authentication with free token provisioning for new users
- Full integration with NemoVideo backend, including session management and credit checking
- Easy workflow for uploading videos, exporting captioned files, and managing subtitle requests
- Designed for educators, creators, marketers, and accessibility advocates wanting automated, high-quality subtitles

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部