返回顶部
s

subtitle-generator-ai字幕生成AI

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
112
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

subtitle-generator-ai

将口语转化为完美时机的字幕

大多数字幕工具只会给你一份原始转录文本,然后把清理工作留给你。subtitle-generator-ai 的工作方式不同——它会聆听视频的音频轨道,将每个单词映射到精确的时间戳,并生成与实际说话内容匹配的字幕,即使面对不同的语速、背景噪音或多位说话者也能准确应对。

这项技能与众不同的地方在于其对话式编辑层。一旦生成字幕,你无需深入时间线或手动编辑原始的 .srt 文件。你只需描述需要修复的内容——演讲者的名字在开场白中拼写错误或缩短第三条字幕,感觉太长了——技能就会在上下文中应用这些更改,并保持同步。

在幕后,OpenClaw 代理协调转录流程,协调时间对齐,并根据你的自然语言指令管理迭代编辑。无论你是在为短视频片段还是完整讲座添加字幕,代理都会跟踪整个字幕会话,使每次修订都基于上一次——无需重新上传,无需从头开始。

环境变量

变量必需默认值
NEMOTOKEN自动生成(100 个免费积分,7 天后过期,可通过设置 → API 令牌撤销)
NEMOAPI_URL
否 | https://mega-api-prod.nemovideo.ai | | NEMOWEBURL | 否 | https://nemovideo.com | | NEMOCLIENTID | 否 | 自动生成的 UUID,持久化到 ~/.config/nemovideo/client_id(仅 UUID,无密钥) | | SKILL_SOURCE | 否 | 从安装路径自动检测,回退为 unknown |

如果未设置 NEMO_TOKEN,请获取一个(需要 X-Client-Id 标头):
bash

生成或读取持久化的 Client-Id


CLIENTID=${NEMOCLIENTID:-$(cat ~/.config/nemovideo/clientid 2>/dev/null)}
if [ -z $CLIENT_ID ]; then
CLIENT_ID=$(uuidgen 2>/dev/null || echo client-$(date +%s)-$RANDOM)
mkdir -p ~/.config/nemovideo && echo $CLIENTID > ~/.config/nemovideo/clientid
fi
curl -s -X POST $API/api/auth/anonymous-token -H X-Client-Id: $CLIENT_ID

→ {code:0,data:{token:nmvusrxxx,credits:100,...}}

将 token 保存为 NEMOTOKEN,CLIENTID 保存为 NEMOCLIENTID。匿名用户:每个客户端每 7 天 1 个令牌;令牌在 7 天后过期,可随时通过 nemovideo.com 上的 设置 → API 令牌 撤销。如果令牌过期,使用相同的 X-Client-Id 请求新令牌。

本地持久化: 此技能将 ~/.config/nemovideo/client_id 写入以跨会话持久化 Client-Id。这避免了每次请求都生成新 ID,从而快速达到每个 IP 的速率限制(默认每个 IP 每 7 天 10 个令牌)。该文件仅包含一个 UUID——本地不存储任何凭据。

2. 将传入请求路由到正确的端点

每个用户操作映射到特定的 API 端点,如下表所示。

用户说...操作跳过 SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加背景音乐...) | → §3.1 SSE | ❌ |

3. 主要工作流程序列

$API = ${NEMOAPIURL:-https://mega-api-prod.nemovideo.ai},$TOKEN = ${NEMOTOKEN},$WEB = ${NEMOWEB_URL:-https://nemovideo.com}。

技能归属变量——请勿硬编码:

  • - $SKILLNAME = 此文件的 YAML 前置元数据 name
  • $SKILLVERSION = 此文件的 YAML 前置元数据 version
  • $SKILL_SOURCE = 在运行时使用第一个匹配项检测:

1. 如果设置了环境变量 SKILL_SOURCE
2. 如果此文件的路径包含已知的平台目录(例如 ~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor)
3. 回退:unknown

关键:所有 API 请求(包括渲染/导出/上传/状态/积分)必须包含这些标头。缺少它们将导致导出失败并返回 402。

X-Skill-Source: $SKILL_NAME
X-Skill-Version: $SKILL_VERSION
X-Skill-Platform: $SKILL_SOURCE

3.0 初始化新会话

bash curl -s -X POST $API/api/tasks/me/with-session/nemo_agent \ -H Authorization: Bearer $TOKEN -H Content-Type: application/json \ -H X-Skill-Source: $SKILLNAME -H X-Skill-Version: $SKILLVERSION -H X-Skill-Platform: $SKILL_SOURCE \ -d {task_name:project,language:}

→ {code:0,data:{taskid:...,sessionid:...}}

在任何操作开始之前,必须与服务器建立会话。此会话 ID 将任务期间的所有后续请求绑定在一起。

在浏览器中打开:创建会话后,为用户提供在 NemoVideo 中查看/编辑任务的链接:
$WEB/workspace/claim?token=$TOKEN&task={taskid}&session={sessionid}&skillname=$SKILLNAME&skillversion=$SKILLVERSION&skillsource=$SKILLSOURCE

3.1 通过 SSE 传递消息

bash curl -s -X POST $API/run_sse \ -H Authorization: Bearer $TOKEN -H Content-Type: application/json \ -H Accept: text/event-stream -H X-Skill-Source: $SKILLNAME -H X-Skill-Version: $SKILLVERSION -H X-Skill-Platform: $SKILL_SOURCE --max-time 900 \ -d {appname:nemoagent,userid:me,sessionid:,new_message:{parts:[{text:}]}}

所有与 AI 的对话式交流都通过服务器发送事件传输,实时将响应流式传输回客户端。

SSE 处理

事件操作
文本响应应用 GUI 翻译(§4),呈现给用户
工具调用/结果
静默等待,不转发 | | heartbeat / 空 data: | 继续等待。每 2 分钟:⏳ 仍在处理... | | 流关闭 | 处理最终响应 |

典型持续时间:文本 5-15 秒,视频生成 100-300 秒,编辑 10-30 秒。

超时:仅心跳持续 10 分钟 → 视为超时。生成期间切勿重新发送(会导致重复和双重计费)。

如果之前的响应正常,忽略尾随的我遇到了临时问题。

静默响应回退(关键)

大约 30% 的编辑操作完成时不会在 SSE 流中返回任何文本。当未收到文本内容时,不要将其视为错误或提示用户重试。相反,立即调用状态查询端点以检索更新后的项目状态,然后根据返回的数据向用户确认成功。

两阶段生成:提交原始视频时,后端自动运行两阶段增强流程。第一阶段处理核心视频输出,第二阶段附加背景音乐和标题序列,无需任何额外输入。等待两个阶段都完成后,再将结果呈现给用户。

3.2 处理文件上传

文件上传:curl -s -X POST $API/api/upload-video/nemoagent/me/ -H Authorization: Bearer $TOKEN -H X-Skill-Source: $SKILLNAME -H X-Skill-Version: $SKILLVERSION -H X-Skill-Platform: $SKILLSOURCE -F files=@/path/to

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 subtitle-generator-ai-1776003122 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 subtitle-generator-ai-1776003122 技能

通过命令行安装

skillhub install subtitle-generator-ai-1776003122

下载

⬇ 下载 subtitle-generator-ai v1.0.0(免费)

文件大小: 7.05 KB | 发布时间: 2026-4-13 12:12

v1.0.0 最新 2026-4-13 12:12
subtitle-generator-ai 1.0.0

- Initial release of subtitle-generator-ai for ClawHub.
- Instantly transcribes spoken audio from video files (mp4, mov, avi, webm, mkv) and generates accurate, time-synced captions.
- Unique conversational editing: refine captions or subtitles through natural language instructions, without manual timeline edits.
- Session-based workflow: tracks all edits and revisions automatically, no need to re-upload videos for changes.
- Built-in support for multiple environments and auto-generated anonymous tokens, with persistent client ID management.
- Exports videos with burned-in captions or in standard subtitle formats, supporting content creators, educators, and accessibility needs.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部