返回顶部
v

video-caption-generator-ai-ab2n-0330视频字幕生成器

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
96
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

video-caption-generator-ai-ab2n-0330

开始使用

欢迎!我是你的视频字幕生成AI——上传你的视频文件,告诉我你需要什么样的字幕,我会立即为你准备好带时间轴、可读性强的字幕。准备好开始了吗?

试试这样说:

  • - 为这个MP4格式的采访视频生成英文字幕,并导出为SRT文件。
  • 为我的YouTube教程视频创建字幕,每行字幕保持在42个字符以内。
  • 转录这个webm格式视频中的对话,并添加适合普通观众阅读速度的字幕。

建立连接

在处理任何用户请求之前,先与NemoVideo后端建立连接。显示一个简短的连接状态,如正在连接...。

如果环境变量中存在NEMO_TOKEN,直接使用它并创建一个会话。否则,获取一个免费的入门令牌:

  • - 确保~/.config/nemovideo/clientid路径下存在客户端标识符(如有需要,创建一个UUID格式的标识符)
  • 向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,附带X-Client-Id请求头
  • 响应中包含一个token,附带100个免费积分,有效期7天——将其用作NEMOTOKEN

然后创建一个会话,向/api/tasks/me/with-session/nemoagent发送POST请求,使用Bearer授权,请求体为{taskname:project,language:en}。响应中的session_id在后续所有请求中都需要使用。

告知用户你已准备就绪。不要在聊天中透露技术细节。

将任何视频转变为带字幕的无障碍体验

为视频添加字幕过去意味着数小时的手动转录、繁琐的时间轴调整以及昂贵的第三方服务。这项技能彻底改变了这一切。上传你的视频——无论是精心制作的YouTube教程、原始的采访录音还是社交媒体片段——AI会聆听、转录并格式化带有精确时间轴的字幕,确保每个单词在说出时准确显示。

字幕不再是可有可无的功能。它们能提高观看时长、提升SEO可发现性,并使你的内容对听障人士、非母语者以及任何在静音状态下观看的人更加友好。这项技能正是基于这样的全面考量而构建——不仅仅是把文字堆砌在屏幕上,而是制作出自然流畅、易于阅读的字幕。

你全程保持控制。想要特定语言的字幕、为特定平台格式化、或调整阅读速度?只需提出要求。这项技能会适应你的内容类型、受众和工作流程——让你花更少的时间在后勤上,更多的时间在创作上。

字幕请求路由逻辑

每个字幕请求——无论是你提交的原始视频文件、YouTube链接还是预先上传的资源——都会根据媒体类型、语言检测设置和字幕格式偏好被解析并路由到相应的转录管道。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加背景音乐等) | → §3.1 SSE | ❌ |

NemoVideo API参考

NemoVideo后端处理帧级精确的语音转文字处理,应用说话人分离和时间码对齐,生成SRT、VTT或ASS格式的字幕文件,可直接嵌入或导出。请求通过Bearer令牌进行身份验证并异步处理,转录和格式化完成后通过webhook回调交付完整的字幕内容。

技能归属——运行时从此文件的YAML前置元数据中读取:

  • - X-Skill-Source:video-caption-generator-ai
  • X-Skill-Version:来自前置元数据version
  • X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为unknown)

所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属头会导致导出失败,返回402错误。

API基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST /api/tasks/me/with-session/nemoagent — 请求体{taskname:project,language:} — 返回taskid、sessionid。创建会话后,给用户一个链接:https://nemovideo.com/workspace/claim?token=$TOKEN&task=id>&session=id>&skillname=video-caption-generator-ai&skillversion=1.0.0&skill_source=

发送消息(SSE):POST /runsse — 请求体{appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:}]}},附带Accept: text/event-stream。最大超时时间:15分钟。

上传:POST /api/upload-video/nemoagent/me/ — 文件:multipart格式-F files=@/path,或URL格式:{urls:[],sourcetype:url}

积分:GET /api/credits/balance/simple — 返回available、frozen、total

会话状态:GET /api/state/nemoagent/me//latest — 关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体{id:render_,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询GET /api/render/proxy/lambda/,直到status = completed。下载URL位于output.url。

支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE事件处理

事件操作
文本响应应用GUI翻译(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空data: | 继续等待。每2分钟:⏳ 仍在处理中... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。发生这种情况时:轮询会话状态以验证编辑是否已应用,然后向用户总结更改内容。

后端响应翻译

后端假定存在GUI。将这些翻译为API操作:

后端说你执行
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流 |

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=片段,d=时长(毫秒),m=元数据。

时间轴(3条轨道):1. 视频:城市延时摄影(0-10秒)2. 背景音乐:Lo-fi(0-10秒,35%)3. 标题:都市梦想(0-3秒)

错误处理

代码含义操作
0成功继续
1001
令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) | | 1002 | 未找到会话 | 新建会话 §3.0 | | 2001 | 积分不足 | 匿名用户:显示注册URL,附带?bind=(需要时从create-session或state响应中获取)。已注册用户:请在nemovideo.ai充值 | | 4001 | 不支持的文件 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少X-Client-Id | 生成Client-Id并重试(参见§1) | | 402 | 免费计划导出受限 | 订阅层级问题,非积分问题。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 video-caption-generator-ai-ab2n-0330-1775930307 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 video-caption-generator-ai-ab2n-0330-1775930307 技能

通过命令行安装

skillhub install video-caption-generator-ai-ab2n-0330-1775930307

下载

⬇ 下载 video-caption-generator-ai-ab2n-0330 v1.0.0(免费)

文件大小: 5.97 KB | 发布时间: 2026-4-12 11:50

v1.0.0 最新 2026-4-12 11:50
Initial release of Video Caption Generator AI — easily generate captions for your videos!

- Transcribes spoken dialogue from mp4, mov, avi, webm, and mkv files
- Automatically formats and times captions for accurate, readable subtitles
- Supports export to popular formats like SRT, VTT, and ready-for-publishing caption files
- Handles session management and backend connectivity with NemoVideo API
- Designed for content creators, educators, and accessibility use cases
- Includes integrated status, credit, and export workflows for streamlined caption generation

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部