返回顶部
v

viral-video-replicator视频逆向复刻

视频逆向复刻 — 分析参考视频(FFmpeg帧提取+Vision LLM) + 生成复刻Seedance 2.0 Prompt + 4种素材替换模式。支持单个和批量。Use when: '复刻这个视频', '分析爆款视频', 'replicate this video', '视频逆向', '反编译视频', '批量分析视频'. Do NOT use for creating from scratch — use fashion-video-creator instead.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.0
安全检测
已通过
78
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

viral-video-replicator

技能:爆款视频复刻器

概述

将参考视频(例如竞品爆款内容)逆向工程为可复现的 Seedance 2.0 提示词。流程:FFmpeg 帧提取 -> 联系表网格 -> 音频提取 + ASR 转录 -> 视觉大模型结构化分析 -> Seedance 提示词组装,可选素材替换(人脸/身体/服装)。支持单视频和批量模式。

何时激活

用户查询包含以下任一内容:

  • - 视频复刻, 视频逆向, 反编译视频, 复刻爆款
  • 分析这个视频, replicate this video, video analysis
  • 批量分析, 批量复刻
  • 这个视频怎么拍的, 帮我分析一下这个爆款, 我想拍一个类似的视频
  • reverse engineer this video, analyze this fashion video

以下情况激活:

  • - 从零创建时尚视频(无参考视频)-> 使用 fashion-video-creator
  • 帮我做个穿搭视频, 生成模特图 -> 使用 fashion-video-creator
  • 纯视频剪辑/修剪 -> 不适用
  • 非时尚视频分析 -> 不适用

前置条件

本地工具(必需):
bash

macOS


brew install ffmpeg

Linux

apt install ffmpeg

验证

ffmpeg -version && ffprobe -version

云 API(通过澄清收集):

必需:ARKAPIKEY + ARKVISIONMODEL(用于帧分析的视觉大模型)
条件性:ASRACCESSTOKEN(如果视频有对话)
条件性:TOS 凭证(如果需要 ASR — 音频通过 TOS 传输)

澄清流程

第一阶段:API 密钥获取

按顺序询问。使用通俗语言 — 解释每个服务的必要性。

问题1:视觉分析(必需)

分析视频内容需要一个能看懂图片的 AI 模型。

它会看视频的截图,识别出人物长相、服装细节、场景布局、动作时间轴。

你有火山方舟的账号和 API Key 吗?还需要视觉模型的ID。

如果没有 API 密钥 -> 停止。 引导用户前往火山方舟。不要继续。

问题2:语音转录(条件性)

参考视频里的人有说话吗?

如果有对话,需要用语音转文字来提取台词 — 这样复刻出的视频才能有完整的对白内容。

没有对话的纯画面视频可以跳过这步。

如果是 -> 询问 ASRACCESSTOKEN。

问题3:音频存储(条件性 — 仅当问题2 = 是)

语音转文字需要通过云存储传输音频文件。

需要火山引擎对象存储(TOS)的 4 个信息:Access Key, Secret Key, Bucket, Region。

如果用户有 ASR 但没有 TOS -> 警告:没有 TOS 则 ASR 无法工作,等同于没有语音转录。

第二阶段:强制性建议

必须展示。每项都有原因说明:

============================================================
API 配置 — 强制性建议
============================================================

[必需] 视觉模型:doubao-seed-1-6-vision-250815 或更新版本
原因:旧模型无法区分服装面料纹理(醋酸 vs 雪纺)、缝线细节(包边 vs 毛边)、
或版型细微差别(修身 vs A字)。分析质量下降约60%。

[必需] 如果视频有对话:配置 BOTH ASR + TOS
原因:没有 ASR,所有口语内容都会丢失。生成的提示词仅包含视觉描述。
视频保真度从约90%下降到约50%,因为对话驱动了40%以上的观众参与度。
TOS 是音频传输管道 — 没有 TOS 意味着没有 ASR。

[必需] 视频分辨率:720p 或更高
原因:帧以 360x640 缩略图提取。低于 480p 的源意味着缩略图是放大后的垃圾 —
服装图案和纹理变成无法识别的色块。

[推荐] 精确模式用于同类别替换
原因:exact 进行嵌套结构化分析(10个字段,带类型化子对象)—
当用一件连衣裙替换另一件时,精度至关重要。
rewrite 进行扁平分析(10个字符串字段)— 更适合跨不同产品类别提取爆款逻辑。
============================================================

第三阶段:模式选择

你要分析几个视频?单个还是批量?

问题5:复刻模式(批量模式下每个视频)

你想怎么复刻?

  • - 精确复刻: 逐帧分析每个细节,尽可能1:1还原
  • 提取改写: 提取爆款节奏和逻辑,用新方式重新演绎

问题6:素材替换(批量模式下每个视频)

要替换视频中的哪些元素?

  • - 不换(纯复刻)
  • 换人脸/身材(上传模特参考图)
  • 换衣服(上传商品图)
  • 都换(上传模特图 + 商品图)

批量模式特定建议

============================================================
批量模式 — 额外建议
============================================================

[必需] 所有视频应为 720p+
原因:一个低分辨率视频不仅自身失败 — 还会浪费调用视觉大模型的 API 成本,
而返回的分析结果不可用。

[推荐] 按复刻模式预分类
原因:精确模式每个视频需要 2-3 分钟(嵌套分析),改写模式需要 1-2 分钟
(扁平分析)。分组可避免上下文切换。

[警告] 每个视频独立运行完整流程。
N 个视频 ≈ N * 2-3 分钟。请相应规划。
============================================================

四种替换模式

模式用户上传内容提示词中的 @图片 标签被替换的内容
克隆无(纯文本)无 — 精确复制
换脸
人脸/身材参考图 | @图片1 = 人脸参考 | 人物被替换,服装保留 | | 换装 | 服装商品图 | @图片1 = 服装 | 服装被替换,人物保留 | | 全换 | 服装 + 人脸参考图 | @图片1 = 服装,@图片2 = 人脸参考 | 两者都被替换 |

模式自动判定:

有人物参考 AND 有服装参考 -> 全换
仅有服装参考 -> 换装
仅有人物参考 -> 换脸
两者皆无 -> 克隆

核心工作流

步骤 0:环境检查(必需,从不跳过)

bash
ffmpeg -version && ffprobe -version

  • - 返回版本 -> 进入步骤 1
  • command not found -> 引导安装(brew/apt/choco)。安装后仍然失败 ->
软降级: 询问用户:FFmpeg 不可用,你能手动提供视频截图和音频文件吗? 如果用户手动提供帧 -> 跳过 FFmpeg 步骤,从步骤 4(视觉分析)开始,使用用户提供的图片。 质量警告(必须向用户展示): 手动截图模式下分析质量会显著降低:无精确时间戳标注、无均匀3fps采样、帧数可能不足导致动作时间轴不准确。建议安装 FFmpeg 以获得最佳效果。 如果用户无法提供帧 -> 停止。 FFmpeg 是自动提取所必需的。

步骤 0b:验证 API 密钥(在到达步骤 4 之前)

尽早验证 ARKAPIKEY,避免因无效密钥浪费 FFmpeg 处理时间:

如果 bash/Python 可用:
python
resp = httpx.get(f{ARKAPIBASE}/api/v3/models,
headers={Authorization: fBearer {ARKAPIKEY}}, timeout=10)

  • - 200 -> 继续
  • 401/403 -> 停止。 密钥无效。修复后再继续。

如果无法执行代码: 信任用户提供的密钥,在首次视觉 API 调用时验证。

单视频模式

步骤 1:收集 API 密钥 + 模式 + 替换素材
步骤 2:提取帧网格(3fps)+ 提取音频 — 通过 asyncio.gather() 并行执行
(两者都是通过 Python 并发启动的 FFmpeg 子进程,不是大模型级别的并行)
阅读 references/frame-extraction.md 了解 FFmpeg 规范
步骤 3:上传音频到 TOS -> ASR 转录
阅读 references/asr-pipeline.md 了解协议
步骤 4:视觉大模型分析(网格 + 转录 -> 结构化 JSON)
阅读 references/vision-analysis.md 了解精确与改写模式的架构
步骤 5:根据上传的素材确定替换模式
步骤 6:组装 Seedance 2.0 提示词
阅读 references/reverse-prompt.md 了解 4 种模式的组装

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 viral-video-replicator-1775883301 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 viral-video-replicator-1775883301 技能

通过命令行安装

skillhub install viral-video-replicator-1775883301

下载

⬇ 下载 viral-video-replicator v1.1.0(免费)

文件大小: 18.71 KB | 发布时间: 2026-4-12 11:52

v1.1.0 最新 2026-4-12 11:52
v1.1.0 — 94分优化版

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部