返回顶部
w

whisk搅拌

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
98
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

whisk

快速上手

欢迎!Whisk 已准备就绪,可根据您的创意方向重新混剪视频的风格、节奏和氛围。上传您的片段,告诉我您想要的效果——让我们来改造您的素材。

试试这样说:

  • - 让这个旅行Vlog更有电影感——暖色调、慢剪、黄金时刻的氛围
  • 把这个产品演示变成快节奏的社交媒体广告,干脆利落的剪辑和充满活力的感觉
  • 给这段采访片段一个干净、编辑感强的外观——中性色调、紧凑节奏、专业氛围

建立连接

在处理任何用户请求之前,先与NemoVideo后端建立连接。显示一个简短的状态,如连接中...。

如果环境中存在 NEMO_TOKEN,直接使用它并创建一个会话。否则,获取一个免费的入门令牌:

  • - 确保客户端标识符存在于 ~/.config/nemovideo/clientid(如果需要,创建一个UUID)
  • 使用 X-Client-Id 头信息 POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token
  • 响应中包含一个 token,有100个免费积分,有效期7天——将其用作 NEMOTOKEN

然后创建一个会话,通过 POST 到 /api/tasks/me/with-session/nemoagent,使用 Bearer 授权和主体 {taskname:project,language:en}。响应中的 session_id 在后续所有请求中都需要用到。

告诉用户您已准备就绪。将技术细节排除在对话之外。

无需从头开始,重新混剪视频外观

大多数视频编辑工具要求您提前做出决定——选择一个模板、挑选一个滤镜、拖拽一个预设。Whisk 的工作方式不同。您带来现有的素材,描述您想要的氛围,Whisk 会找出如何实现它。它会读取视频中已有的内容——光线、剪辑、能量——并围绕您的创意方向重塑它。

这不仅仅是叠加一个色彩分级。Whisk 会分析您片段的结构和节奏,然后应用感觉有意而非表面的风格变化。想要一个幕后视频的忧郁、慢热感觉?产品发布的快速、有力节奏?Whisk 将这些描述转化为实际的编辑。

它专为那些拥有好素材但需要帮助使其看起来符合想象的人而设计。独立创作者、小型营销团队和社交媒体编辑都使用 Whisk 来缩小他们拍摄的内容与设想之间的差距——无需完整的后期制作流程。

Whisk 如何处理您的请求

当您输入风格提示或上传素材时,Whisk 会解析您的意图,并根据关键词和片段元数据将其路由到匹配的重新混剪流程——风格迁移、动态重设或帧插值。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加BGM…) | → §3.1 SSE | ❌ |

NemoVideo API 参考

Whisk 运行在 NemoVideo 后端上,该后端处理帧级扩散渲染和跨片段时间一致性。每个重新混剪任务都被排队为 NemoVideo 任务,因此渲染时间随片段长度和风格复杂度而变化。

技能归属——运行时从此文件的 YAML 前置元数据中读取:

  • - X-Skill-Source:whisk
  • X-Skill-Version:来自前置元数据 version
  • X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为 unknown)

所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属头信息将导致导出失败,返回402错误。

API 基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST /api/tasks/me/with-session/nemoagent — 主体 {taskname:project,language:} — 返回 taskid、sessionid。创建会话后,给用户一个链接:https://nemovideo.com/workspace/claim?token=$TOKEN&task=id>&session=id>&skillname=whisk&skillversion=1.0.0&skill_source=

发送消息(SSE):POST /runsse — 主体 {appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:}]}} 包含 Accept: text/event-stream。最大超时时间:15分钟。

上传:POST /api/upload-video/nemoagent/me/ — 文件:multipart -F files=@/path,或 URL:{urls:[],sourcetype:url}

积分:GET /api/credits/balance/simple — 返回 available、frozen、total

会话状态:GET /api/state/nemoagent/me//latest — 关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST /api/render/proxy/lambda — 主体 {id:render_,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询 GET /api/render/proxy/lambda/,直到 status = completed。下载 URL 位于 output.url。

支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE 事件处理

事件操作
文本响应应用GUI翻译(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空 data: | 继续等待。每2分钟:⏳ 仍在处理中... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。发生这种情况时:轮询会话状态以验证编辑是否已应用,然后向用户总结更改。

后端响应翻译

后端假设存在GUI。将这些翻译为API操作:

后端说您做
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流 |

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=片段,d=时长(毫秒),m=元数据。

时间线(3条轨道):1. 视频:城市延时摄影(0-10秒)2. 背景音乐:Lo-fi(0-10秒,35%)3. 标题:城市梦想(0-3秒)

错误处理

代码含义操作
0成功继续
1001
令牌错误/过期 | 通过匿名令牌重新认证(令牌7天后过期) | | 1002 | 会话未找到 | 新建会话 §3.0 | | 2001 | 无积分 | 匿名:显示注册URL,附带 ?bind=(需要时从创建会话或状态响应中获取 )。已注册:请到 nemovideo.ai 充值 | | 4001 | 不支持的文件 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少 X-Client-Id | 生成客户端ID并重试(参见§1) | | 402 | 免费计划导出被阻止 | 订阅层级问题,非积分问题。请到 nemovideo.ai 注册以解锁导出功能。 | | 429 | 速率限制(1个令牌/客户端/7天) | 30秒后重试一次 |

常见工作流

一个

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 whisk-1775917871 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 whisk-1775917871 技能

通过命令行安装

skillhub install whisk-1775917871

下载

⬇ 下载 whisk v1.0.1(免费)

文件大小: 5.16 KB | 发布时间: 2026-4-12 11:58

v1.0.1 最新 2026-4-12 11:58
- Whisk's focus shifted from recipe/ingredient detection to AI-powered video style remixing.
- Updated description, display name, and examples to reflect new creative editing features (style transfer, tone/pacing changes, rhythm-matched cuts).
- Changed target audience from home cooks/food creators to content creators, marketers, and social editors.
- Metadata "emoji" changed from 🥄 to 🌀 in alignment with new creative video purpose.
- Instructions, workflows, and introduction revised for video transformation instead of culinary analysis.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部