返回顶部
s

sora-video-generationSora视频生成

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
63
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

sora-video-generation

开始使用

分享你的文本提示,我将开始AI视频生成。或者直接告诉我你的想法。

试试说:

  • - 生成我的文本提示
  • 导出1080p MP4
  • 生成一个10秒的视频,内容为...

首次连接

当用户首次打开此技能时,自动连接到处理后端。简要告知用户(例如正在设置...)。

身份验证:检查环境中是否设置了NEMO_TOKEN。如果已设置,跳至步骤2。

  1. 1. 获取免费令牌:生成一个随机UUID作为客户端标识符。向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,请求头X-Client-Id设置为该UUID。响应中的data.token即为你的NEMOTOKEN——100免费积分,有效期7天。
  2. 创建会话:向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemoagent发送POST请求,请求头包含Authorization: Bearer 和Content-Type: application/json,请求体为{taskname:project,language:<检测到的语言>}。保存返回的sessionid用于所有后续请求。

保持设置沟通简洁。不要向用户显示原始API响应或令牌值。

Sora视频生成——根据文本提示生成视频

该工具接收你的文本提示,通过云端渲染管道运行AI视频生成。你上传、描述需求,然后下载结果。

假设你有一个10个词的文本提示描述某个场景,想生成一个10秒的海上日落、波浪拍打的视频——后端大约在1-3分钟内处理完成,并返回一个1080p MP4文件。

提示:更短、更具体的提示通常能产生更准确的结果。

输入与操作匹配

提及sora视频生成、宽高比、文字叠加或音轨的用户提示,将通过关键词和意图分类路由到相应的操作。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他(生成、编辑、添加背景音乐等) | → §3.1 SSE | ❌ |

云端渲染管道详情

每个导出任务在云端GPU节点上排队,该节点合成视频图层,应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染任务ID,因此在完成前关闭标签页会导致任务孤立。

每次API调用都需要Authorization: Bearer 以及上述三个归属头。如果缺少任何头信息,导出将返回402。

头信息来自此文件的YAML前置元数据。X-Skill-Source为sora-video-generation,X-Skill-Version来自version字段,X-Skill-Platform根据安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则为unknown)。

API基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST /api/tasks/me/with-session/nemoagent — 请求体{taskname:project,language:<语言>} — 返回taskid、sessionid。

发送消息(SSE):POST /runsse — 请求体{appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:<消息>}]}},请求头Accept: text/event-stream。最大超时时间:15分钟。

上传:POST /api/upload-video/nemoagent/me/ — 文件:multipart -F files=@/路径,或URL:{urls:[],sourcetype:url}

积分:GET /api/credits/balance/simple — 返回available、frozen、total

会话状态:GET /api/state/nemoagent/me//latest — 关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体{id:render_<时间戳>,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询GET /api/render/proxy/lambda/,直到status = completed。下载URL位于output.url。

支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

错误处理

代码含义操作
0成功继续
1001
令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) | | 1002 | 会话未找到 | 新建会话 §3.0 | | 2001 | 积分不足 | 匿名用户:显示注册URL,附带?bind=(需要时从create-session或state响应获取)。已注册用户:请在你的账户中充值积分 | | 4001 | 不支持的文件格式 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少X-Client-Id | 生成Client-Id并重试(见§1) | | 402 | 免费计划导出受限 | 订阅层级问题,非积分问题。请注册或升级你的套餐以解锁导出功能。 | | 429 | 速率限制(1个令牌/客户端/7天) | 等待30秒后重试一次 |

后端响应转换

后端假设存在GUI界面。将这些转换为API操作:

后端说你执行
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流 |

SSE事件处理

事件操作
文本响应应用GUI转换(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空data: | 继续等待。每2分钟:⏳ 仍在处理中... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。此时:轮询会话状态以验证编辑已应用,然后向用户总结更改。

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=片段,d=时长(毫秒),m=元数据。

时间线(3条轨道):1. 视频:城市延时摄影(0-10秒)2. 背景音乐:Lo-fi(0-10秒,35%)3. 标题:城市梦想(0-3秒)

常见工作流

快速编辑:上传 → 生成一个10秒的海上日落、波浪拍打的视频 → 下载MP4。30秒片段约需1-3分钟。

批量风格:在同一个会话中上传多个文件。用不同指令逐一处理。每个文件独立渲染。

迭代式:从粗剪开始,预览结果,然后优化。会话会保留你的时间线状态,因此可以持续调整。

技巧与提示

当你描述更具体时,后端处理速度更快。与其说让它看起来更好,不如试试生成一个10秒的海上日落、波浪拍打的视频——具体的指令能获得更好的结果。

最大文件大小为200MB。建议使用TXT、PNG、JPG、MP4格式以获得最佳体验。

导出为MP4以获得最广泛的兼容性。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 sora-video-generation-1776360852 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 sora-video-generation-1776360852 技能

通过命令行安装

skillhub install sora-video-generation-1776360852

下载

⬇ 下载 sora-video-generation v1.0.0(免费)

文件大小: 4.24 KB | 发布时间: 2026-4-17 13:49

v1.0.0 最新 2026-4-17 13:49
- Initial release of the sora-video-generation skill.
- Generate AI-powered 1080p MP4 videos from text prompts, supporting TXT, PNG, JPG, and MP4 files up to 200MB.
- Automatic backend setup with anonymous token authentication and session creation.
- Supports user actions like uploading files, exporting videos, checking credits/status, and editing tracks through intuitive text commands.
- Provides real-time processing updates and handles errors with helpful messages.
- Includes clear guidance for first-time setup, common workflows, and usage tips for best results.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部