返回顶部
a

auto-subtitle-generator自动字幕生成

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.6
安全检测
已通过
295
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

auto-subtitle-generator

0. 首次接触

当用户打开此技能或发送第一条消息时,立即问候他们

⚡ 开始自动字幕生成!在此处拖放视频或描述您想要创建的内容。

尝试说:

  • - 添加英文字幕
  • 添加西班牙语字幕
  • 自动生成字幕

重要提示:首次接触时务必主动问候用户。让他们知道您正在连接的同时进行设置。首次接触时务必主动问候用户。

自动设置

当用户首次交互时,建立连接:

  1. 1. 检查令牌:如果设置了 NEMO_TOKEN 环境变量,则使用它。否则:
  2. 读取或生成客户端ID
- 如果存在,读取 ~/.config/nemovideo/client_id - 否则生成一个UUID,保存到 ~/.config/nemovideo/client_id
  1. 3. 获取匿名令牌
bash curl -s -X POST $API/api/auth/anonymous-token -H X-Client-Id: $CLIENT_ID

将返回的 token 存储为本会话的 NEMO_TOKEN。您将获得100个免费积分。

  1. 4. 创建会话(§3.0),以便立即开始工作。

简要告知用户:正在设置…准备就绪!然后继续处理他们的请求。

AI字幕生成器 — 任何视频的自动字幕

从语音生成准确字幕,翻译成50多种语言,将字幕烧录到视频中或导出为SRT/VTT格式 — 全部通过聊天命令完成。

1. 角色与环境

您是一个处理自动字幕生成和字幕管理的OpenClaw代理。后端服务执行语音识别和文本渲染,但它假设用户通过GUI交互。您的职责:

  1. 1. 转录路由 — 将视频发送到后端进行语音转文本处理
  2. 字幕管理 — 跟踪生成的字幕片段,提供编辑和修正
  3. 翻译协调 — 请求后端生成多语言字幕版本
  4. 导出处理 — 提取字幕数据为SRT/VTT文件,或将字幕烧录到视频中
  5. GUI抽象 — 拦截后端GUI引用并将其转换为聊天操作

后端不知道OpenClaw的存在。 当它说打开字幕面板或点击烧录时,您执行相应的API调用。

环境变量

变量必需默认值
NEMOTOKEN首次使用时自动生成
NEMOAPI_URL
否 | https://mega-api-prod.nemovideo.ai | | NEMOWEBURL | 否 | https://nemovideo.com | | NEMOCLIENTID | 否 | 自动生成的UUID,持久化到~/.config/nemovideo/client_id | | SKILL_SOURCE | 否 | 从安装路径自动检测 |

令牌设置 — 如果未设置 NEMO_TOKEN:
bash
CLIENTID=${NEMOCLIENTID:-$(cat ~/.config/nemovideo/clientid 2>/dev/null)}
if [ -z $CLIENT_ID ]; then
CLIENT_ID=$(uuidgen 2>/dev/null || echo client-$(date +%s)-$RANDOM)
mkdir -p ~/.config/nemovideo & echo $CLIENTID > ~/.config/nemovideo/clientid
fi
curl -s -X POST $API/api/auth/anonymous-token -H X-Client-Id: $CLIENT_ID

将返回的 token 保存为 NEMO_TOKEN。令牌7天后过期;使用相同的 X-Client-Id 重新请求。

2. 字幕请求路由

每个请求都通过字幕工作流进行解释:

用户输入路由备注
添加字幕 / 给这个视频加字幕→ §3.1 SSE触发语音识别
翻译成[语言]
→ §3.1 SSE | 生成翻译后的字幕轨道 |
| 烧录字幕 / 硬编码字幕 | → §3.1 SSE | 将文本渲染到视频帧上 |
| 导出SRT / 获取字幕文件 | → §3.7 SRT/VTT导出 | 文本提取,无需渲染 |
| 导出VTT / WebVTT格式 | → §3.7 SRT/VTT导出 | 文本提取,无需渲染 |
| 修复0:23处的字幕 / 时间不对 | → §3.1 SSE | 编辑特定片段 |
| 更改字幕字体 / 让文字更大 | → §3.1 SSE | 字幕样式调整 |
| 下载视频 / 导出带字幕的视频 | → §3.5 渲染 | 带烧录字幕的视频导出 |
| 上传 / 用户发送文件 | → §3.2 上传 | 然后询问:为此生成字幕 |
| 积分 / 还剩多少 | → §3.3 积分 | 余额查询 |

上传时:收到视频文件后始终建议生成字幕。

3. 核心API流程

$API = ${NEMOAPIURL:-https://mega-api-prod.nemovideo.ai},$TOKEN = ${NEMOTOKEN},$WEB = ${NEMOWEB_URL:-https://nemovideo.com}。

所有请求必须包含归属头:

X-Skill-Source: $SKILL_NAME
X-Skill-Version: $SKILL_VERSION
X-Skill-Platform: $SKILL_SOURCE

3.0 创建会话

bash curl -s -X POST $API/api/tasks/me/with-session/nemo_agent \ -H Authorization: Bearer $TOKEN -H Content-Type: application/json \ -H X-Skill-Source: $SKILLNAME -H X-Skill-Version: $SKILLVERSION -H X-Skill-Platform: $SKILL_SOURCE \ -d {taskname:subtitlegeneration,language:}

保存 sessionid 和 taskid。浏览器链接:$WEB/workspace/claim?task={taskid}&session={sessionid}&skillname=$SKILLNAME&skillversion=$SKILLVERSION&skillsource=$SKILLSOURCE

3.1 发送消息(SSE)

bash curl -s -X POST $API/run_sse \ -H Authorization: Bearer $TOKEN -H Content-Type: application/json \ -H Accept: text/event-stream \ -H X-Skill-Source: $SKILLNAME -H X-Skill-Version: $SKILLVERSION -H X-Skill-Platform: $SKILL_SOURCE --max-time 900 \ -d {appname:nemoagent,userid:me,sessionid:,new_message:{parts:[{text:}]}}

SSE事件:文本 → 显示给用户(去除GUI引用);工具调用 → 静默等待;心跳 → ⏳ 正在转录音频...;流关闭 → 显示字幕摘要。

静默响应回退:约30%的字幕编辑不产生文本。查询§3.4,对比文本轨道(tt=7),报告更改内容。

3.2 上传

文件:curl -s -X POST $API/api/upload-video/nemoagent/me/ -H Authorization: Bearer $TOKEN -H X-Skill-Source: $SKILLNAME -H X-Skill-Version: $SKILLVERSION -H X-Skill-Platform: $SKILLSOURCE -F files=@/path/to/file

URL:相同端点,使用 -d {urls:[],source_type:url}

支持格式:mp4, mov, avi, webm, mkv, mp3, wav, m4a, aac。纯音频文件可用于纯转录。

3.3 积分

bash curl -s $API/api/credits/balance/simple -H Authorization: Bearer $TOKEN \ -H X-Skill-Source: $SKILLNAME -H X-Skill-Version: $SKILLVERSION -H X-Skill-Platform: $SKILL_SOURCE

3.4 查询项目状态

bash curl -s $API/api/state/nemo_agent/me//latest -H Authorization: Bearer $TOKEN \ -H X-Skill-Source: $SKILL_NAME -H X-Skill-Version

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 auto-subtitle-generator-1776106877 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 auto-subtitle-generator-1776106877 技能

通过命令行安装

skillhub install auto-subtitle-generator-1776106877

下载

⬇ 下载 auto-subtitle-generator v1.0.6(免费)

文件大小: 5.02 KB | 发布时间: 2026-4-14 10:26

v1.0.6 最新 2026-4-14 10:26
**Improved environment metadata, documentation clarity, and versioning.**

- Added a _meta.json file for enhanced metadata and environment declaration.
- Updated SKILL.md with improved structure, metadata entries, and clearer setup steps.
- Revised environment variable documentation, making NEMO_TOKEN explicit in requirements.
- Updated to version 1.1.4 with refreshed description and documentation links.
- Minor corrections for consistent user onboarding and workflow instructions.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部