返回顶部
t

text-to-video-generator-ai文本转视频AI

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
101
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

text-to-video-generator-ai

开始使用

欢迎——你只需输入一段文字提示,就能生成视频。描述你的场景、概念或故事,这个文本转视频生成器将为你将其构建成视觉内容。在下方输入你的提示词即可开始。

试试这样说:

  • - 为咖啡品牌生成一段30秒的推广视频,采用温暖的电影感晨间美学,柔和光线搭配热气腾腾咖啡杯的特写镜头
  • 制作一段关于太阳能电池板工作原理的简短解说视频,面向初中生,使用简单动画和明快的视觉风格
  • 将这段产品描述转化为15秒的社交媒体视频片段,搭配粗体文字叠加和快节奏剪辑:我们的新款跑鞋专为速度、舒适度和全地形抓地力而设计

首次连接

当用户首次打开此技能时,自动连接到处理后端。简要告知用户(例如正在设置...)。

身份验证:检查环境中是否设置了NEMO_TOKEN。如果已设置,直接跳至步骤2。

  1. 1. 获取免费令牌:生成随机UUID作为客户端标识符。向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,请求头X-Client-Id设置为该UUID。响应中的data.token即为你的NEMOTOKEN——100个免费积分,有效期7天。
  2. 创建会话:向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemoagent发送POST请求,包含Authorization: Bearer 、Content-Type: application/json以及请求体{taskname:project,language:<检测到的语言>}。存储返回的sessionid用于所有后续请求。

保持设置过程简洁。不要向用户显示原始API响应或令牌值。

从文字到动态视频

大多数视频创作工具都假设你已有素材。但这个工具不同。文本转视频生成器技能仅以你的文字为起点——一句话、一段文字、一份创意简报——并围绕它们从头构建视频内容。

描述产品发布、短篇故事、社交媒体广告或解说概念,该技能会解读你的意图,选择合适的视觉风格,并组合成连贯的视频序列。你控制基调、主题和叙事弧线。技能负责视觉转化。

这对于需要快速行动且无需完整制作流程即可获得视频资产的团队特别有用。营销人员可以在正式拍摄前制作广告概念原型。教育工作者可以为课程生成说明性片段。独立创作者可以在拍摄前将脚本可视化。无论你的工作流程如何,这个技能都能在创意与执行之间架起桥梁。

提示词路由与模型调度

你提交的每个文本提示词都会被解析,分析场景复杂度、运动描述和风格标签,然后分派到最优的扩散模型管道进行渲染。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加背景音乐等) | → §3.1 SSE | ❌ |

视频合成API参考

所有视频生成任务通过异步云渲染后端在分布式GPU集群上运行,帧合成、时间一致性处理和输出编码均在服务器端完成。生成的视频资产存储在安全的会话存储桶中,并在任务完成后通过签名CDN URL交付。

技能归属——运行时从此文件的YAML前置元数据读取:

  • - X-Skill-Source:text-to-video-generator-ai
  • X-Skill-Version:来自前置元数据version
  • X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,其他则为unknown)

所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属标头将导致导出失败,返回402错误。

API基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST /api/tasks/me/with-session/nemoagent — 请求体{taskname:project,language:<语言>} — 返回taskid、sessionid。

发送消息(SSE):POST /runsse — 请求体{appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:<消息>}]}},包含Accept: text/event-stream。最大超时时间:15分钟。

上传:POST /api/upload-video/nemoagent/me/ — 文件:multipart格式-F files=@/路径,或URL:{urls:[],sourcetype:url}

积分查询:GET /api/credits/balance/simple — 返回available、frozen、total

会话状态:GET /api/state/nemoagent/me//latest — 关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体{id:render_<时间戳>,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询GET /api/render/proxy/lambda/,直到status = completed。下载URL位于output.url。

支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE事件处理

事件操作
文本响应应用GUI翻译(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空data: | 继续等待。每2分钟:⏳ 仍在处理... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。发生这种情况时:轮询会话状态以验证编辑是否已应用,然后向用户总结更改内容。

后端响应翻译

后端假定存在GUI。将这些翻译为API操作:

后端说你执行
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流 |

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=片段,d=时长(毫秒),m=元数据。

时间线(3条轨道):1. 视频:城市延时摄影(0-10秒)2. 背景音乐:Lo-fi(0-10秒,35%)3. 标题:都市梦想(0-3秒)

错误处理

代码含义操作
0成功继续
1001
令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) | | 1002 | 会话未找到 | 新建会话 §3.0 | | 2001 | 积分不足 | 匿名用户:显示注册URL,附带?bind=(需要时从create-session或state响应获取)。已注册用户:请在你的账户中充值积分 | | 4001 | 不支持的文件格式 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少X-Client-Id | 生成Client-Id并重试(参见§1) | | 402 | 免费计划导出被阻止 | 订阅层级问题,非积分问题。请注册或升级你的计划以解锁导出功能。 | | 429 | 速率限制(1个令牌/客户端/7天) | 等待30秒后重试一次 |

快速入门指南

生成你的第一个视频很简单。首先编写一个清晰、具体的文本提示词,描述你希望视频展示的内容。包括主题、视觉基调

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 text-to-video-generator-ai-1775706061 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 text-to-video-generator-ai-1775706061 技能

通过命令行安装

skillhub install text-to-video-generator-ai-1775706061

下载

⬇ 下载 text-to-video-generator-ai v1.0.0(免费)

文件大小: 5.64 KB | 发布时间: 2026-4-11 23:01

v1.0.0 最新 2026-4-11 23:01
Initial release of Text-to-Video Generator AI — instantly turn written prompts into video content.

- Converts plain text prompts into fully rendered videos with visuals, pacing, and stylistic matching.
- Automatic first-time backend and session setup with seamless authentication (100 free credits).
- Supports video creation, uploading media, checking credits, tracking generation status, and exporting output.
- Handles prompt parsing and routes requests to the appropriate API endpoints for generation, editing, or export.
- Includes robust error handling, session management, and detailed event/response processing.
- Wide format support: mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部