返回顶部
v

voiceover-app配音应用

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
81
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

voiceover-app

开始使用

欢迎!我在此协助您创作、润色和把控配音脚本,让您的视频栩栩如生。请告诉我您的视频内容——涵盖的主题、目标受众以及期望的风格——让我们共同打造您的旁白。

试试这样说:

  • - 为一款面向小企业主的新项目管理应用的产品演示视频,撰写一段90秒的配音脚本。
  • 将这个3分钟的解释性脚本分解为带时间戳的提示点,以便我能与视频时间轴同步录制。
  • 重写我现有的配音草稿,使其听起来更温暖、更口语化——目前感觉过于生硬和商业化了。

自动设置

首次交互时,请先连接到处理API。显示简短状态,如正在设置...

令牌:如果已设置NEMO_TOKEN环境变量,则使用它并跳至下方的会话部分。

免费令牌:在~/.config/voiceover-app/clientid处读取或创建一个UUID。然后向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,附带标头X-Client-Id: 。响应字段data.token即为您的NEMOTOKEN(100积分,7天有效期)。如果令牌已过期,请使用相同的Client-Id请求一个新令牌。

会话:向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemoagent发送POST请求,使用Bearer认证,请求体为{taskname:project}。从响应中保存session_id。

向用户确认您已连接并准备就绪。不要打印令牌或原始JSON。

为您的视频注入引人入胜的声音

出色的视频内容不仅关乎观众所见——更关乎他们所闻。精心制作的配音能将粗糙的剪辑转变为精致、专业的作品,牢牢抓住注意力并清晰传达信息。voiceover-app技能旨在帮助您创作自然、有目的且与画面完美同步的旁白。

无论您是运营YouTube频道的独立创作者、构建电子学习模块的教学设计师,还是制作产品演示的营销团队,这项技能都能满足您的需求。您可以根据视频的简要描述生成完整的配音脚本,优化现有旁白的语气和节奏,或将长脚本分解为与时间轴匹配的带时间戳提示点。

目标很简单:消除配音制作中的障碍。无需面对空白页面或纠结于生硬的措辞,您只需几秒钟就能获得一份可立即录制或放心交给配音演员的草稿。每一份输出都是为听而写,而非为看而写,因此您的旁白听起来总是恰如其分。

路由将任务导向正确轨道

当您提交旁白请求时——无论是补录、同步新的音轨,还是清除录制片段中的噪音——ClawHub会解析意图并自动将其路由到匹配的配音工作流程。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加背景音乐等) | → §3.1 SSE | ❌ |

云端引擎API参考

所有音频处理均通过基于云的渲染后端运行,该后端实时处理波形对齐、ADR同步和降噪,而不会加重本地机器的负担。会话状态、片段元数据和混音设置保存在服务器端,确保您的项目在不同设备间保持完整。

技能归属——运行时从此文件的YAML前置元数据中读取:

  • - X-Skill-Source: voiceover-app
  • X-Skill-Version: 来自前置元数据 version
  • X-Skill-Platform: 从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为 unknown)

所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属标头将导致导出失败,返回402错误。

API基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST /api/tasks/me/with-session/nemoagent — 请求体 {taskname:project,language:} — 返回 taskid、sessionid。

发送消息(SSE):POST /runsse — 请求体 {appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:}]}},附带 Accept: text/event-stream。最大超时时间:15分钟。

上传:POST /api/upload-video/nemoagent/me/ — 文件:multipart -F files=@/path,或URL:{urls:[],sourcetype:url}

积分:GET /api/credits/balance/simple — 返回 available、frozen、total

会话状态:GET /api/state/nemoagent/me//latest — 关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体 {id:render_,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询GET /api/render/proxy/lambda/,直到 status = completed。下载URL位于 output.url。

支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE事件处理

事件操作
文本响应应用GUI翻译(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空 data: | 继续等待。每2分钟:⏳ 仍在处理... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。发生这种情况时:轮询会话状态以验证编辑是否已应用,然后向用户总结更改。

后端响应翻译

后端假定存在GUI。将这些翻译为API操作:

后端说您做
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流程 |

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=片段,d=时长(毫秒),m=元数据。

时间轴(3条轨道):1. 视频:城市延时摄影(0-10秒) 2. 背景音乐:Lo-fi(0-10秒,35%) 3. 标题:都市梦想(0-3秒)

错误处理

代码含义操作
0成功继续
1001
令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) | | 1002 | 未找到会话 | 新建会话 §3.0 | | 2001 | 无积分 | 匿名用户:显示注册URL,附带?bind=(需要时从create-session或state响应获取)。已注册用户:请为您的账户充值积分 | | 4001 | 不支持的文件 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少X-Client-Id | 生成Client-Id并重试(参见§1) | | 402 | 免费计划导出被阻止 | 订阅层级问题,非积分问题。请注册或升级您的计划以解锁导出功能。 | | 429 | 速率限制(1个令牌/客户端/7天) | 30秒后重试一次 |

常见问题解答

这个技能能为任何类型的视频撰写配音脚本吗?

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 voiceover-app-1775898308 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 voiceover-app-1775898308 技能

通过命令行安装

skillhub install voiceover-app-1775898308

下载

⬇ 下载 voiceover-app v1.0.0(免费)

文件大小: 5.42 KB | 发布时间: 2026-4-12 11:53

v1.0.0 最新 2026-4-12 11:53
Voiceover App skill v1.0.0

- Initial release of the Voiceover App skill for crafting, refining, and syncing professional narration with video content.
- Enables users to write, edit, and break down voiceover scripts, generate cue points, and adjust tone or pacing.
- Provides automatic setup with environment or free API token handling, and session management.
- Supports video/audio upload, export to multiple formats, and balance or session state checks.
- Integrates robust error handling and workflow routing based on user intent for a seamless narration production process.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部