返回顶部
v

videogen视频AI流水线

视频号AI短视频自动化生产流水线(v2)。用户说"做视频"、"生成视频"、"短视频制作"、"视频混剪"时触发。支持三种内容模式自动切换(Mode A纯干货 / Mode B剧情+科普 / Mode C漫剧型)。使用 MiniMax Hailuo AI 生成视频片段,配合 FFmpeg 混剪,输出适合视频号发布的完整短视频。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.2.0
安全检测
已通过
176
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

videogen

videogen v2 — 视频号 AI 短视频自动化生产流水线

⚠️ 重要前置说明

API 体系

API Key 类型开头支持能力
MiniMax Keysk-cp-TTS (speech-2.8-hd) ✅、Hailuo 视频生成 ✅、Music ❌
IMA Key
ima_ | SeeDream 生图、Wan/Kling 视频(数字分身必需) |

每日额度:usage limit exceeded (2056) 报错表示当日 Hailuo 视频额度耗尽,需次日恢复。当前 key 不支持 music-2.5+。

API 错误处理规范

错误码 含义 处理
─────────────────────────────────────────────────────────────
2056 usage limit exceeded 跳过该片段继续后续步骤
其他异常 未知错误 记录错误,换策略继续,不卡死



三种内容模式

系统根据选题自动判断最优内容模式(可手动指定覆盖):

Mode A — 纯干货型

适用:财经分析、技术教程、行业报告、数据解读、科普讲解

结构:开场痛点(3s) → 核心要点×3(各12s) → 金句收尾(9s)

视觉:PPT/图表为主,AI点缀关键帧(数字动画、光芒效果)

开场 → 数据页 → 讲解页 → 数据页 → 讲解页 → 数据页 → 讲解页 → 金句

Mode B — 剧情+科普型 ✨ 新版主打

适用:职业发展、认知升级、社会洞察、励志干货

结构:剧情钩子(8s) → 问题拆解(15s) → 干货×2(各12s) → 升华收尾(10s)

视觉:剧情画面 + 干净科普画面混合,兼顾情感共鸣与信息密度

剧情开场(困境) → 问题拆解 → 剧情演绎+干货 → 剧情演绎+干货 → 升华+关注引导

Mode C — 漫剧/剧情型

适用:人生转折、励志逆袭、情感故事、人情冷暖

结构:起(8s) → 承(12s) → 转(20s) → 合(8s) + 金句收尾

视觉:角色全程驱动,强戏剧冲突,色调/情绪变化明显

建立(平凡) → 转折(至暗) → 挣扎 → 行动序列×3 → 蜕变(成功) → 金句



增强版分镜字段

json
{
panel_number: 1,
scene_type: 剧情场景 | 知识讲解 | 数据展示 | 过渡页,
shot_type: 特写 | 近景/中景 | 中景 | 全景 | 远景/建立景 | POV主观视角,
camera_move: 固定镜头 | 推进 | 拉出 | 左摇 | 右摇 | 上摇 | 下摇 | 移动摄影 | 跟随,
description: 画面文字描述(供PPT/绘图AI使用),
video_prompt: Hailuo视频生成Prompt(镜头控制+主体+氛围+动态+风格),
narration: 旁白/台词,
duration: 5,
transition: 硬切 | 淡入淡出 | 溶解 | 滑入
}

Video Prompt 公式(参考《AIGC短视频策划与制作》):

镜头描述 + 镜头运动 + 主体内容 + 动态元素 + 风格 + 9:16竖屏



使用方式

方式一:直接对话(推荐)

直接告诉我选题或发链接,我来判断模式并执行完整流水线:

python scripts/v2/run_pipeline.py gen 选题内容
python scripts/v2/run_pipeline.py gen https://mp.weixin.qq.com/s/xxx # 微信文章
python scripts/v2/run_pipeline.py gen https://zhuanlan.zhihu.com/p/xxx # 知乎文章

URL 内容提取

支持自动识别并提取以下来源的正文内容:

来源支持状态提取内容
微信公众号文章✅ 完整支持标题、作者、正文
知乎文章/回答
✅ 完整支持 | 标题、作者、发布时间、正文 |
| 通用网页 | ✅ 支持(BS4) | 标题、正文(trafilatura 更优)|

bash

单独测试 URL 提取


python scripts/v2/url_extractor.py https://mp.weixin.qq.com/s/xxx
python scripts/v2/url_extractor.py https://zhuanlan.zhihu.com/p/xxx --summarize

提取 + 生成摘要 + 生成分镜(管道)

python scripts/v2/url_extractor.py URL --summarize -o extracted.json

方式二:分步执行

bash

Step 1: 分析选题(自动检测模式)


python scripts/v2/run_pipeline.py analyze AI将取代哪些职业

Step 2: 生成分镜(可指定模式)

python scripts/v2/run_pipeline.py storyboard 失业后的逆袭之路 --mode auto

Step 3: 完整流水线

python scripts/v2/run_pipeline.py gen 选题 --mode auto --duration 60

方式三:旧版快速模式(兼容)

bash
bash skills/videogen/scripts/buildcomposite.sh [slidevideo] [output] [clips...]



完整流水线(v2)

选题 → [自动模式检测] → 分镜生成 → TTS配音 → AI视频片段 → FFmpeg混剪 → 最终视频

Step 1: 选题分析

自动检测三要素:

  • - 剧情关键词:失业/逆袭/情感/故事/第一人称经历 → Mode C
  • 混合关键词:职场/认知/赚钱/成长 → Mode B
  • 干货关键词:教程/数据/科普/技术/行业报告 → Mode A

Step 2: 增强分镜生成(参考 waoowaoo 多阶段架构)

  • - Phase 1:结构规划(镜头数量、景别、场景类型)
  • Phase 2:运镜+表演(cinematography + acting 并行)
  • Phase 3:细节补充 + video_prompt 生成

Step 3: TTS 配音(v2 — Harness 模式)

Harness 核心思路:在 TTS 这个不确定节点外面套「校验 → 修复 → 循环」控制环,让输出趋向收敛。

四个组件

组件作用
Chunk 化按句子切分(≤200字/段),改一个词只重做该 chunk
约束系统(Rules)
TTS 前规范化文本(英文品牌名隔断、数字转中文、连字符转空格等) |
| 双层评估 | L1 确定性预检(文件/时长/语速)+ L2 Whisper X 语义校验 |
| 跨轮记忆 | normalize_patches.json — 修复确认后写入,下期自动加载 |

默认启用 Harness(--no-harness 可关闭):

bash

Harness 模式(默认)


python scripts/v2/run_pipeline.py gen 选题 --mode auto --duration 60

关闭 Harness(快速旧版)

python scripts/v2/run_pipeline.py gen 选题 --no-harness

单独测试 TTS Harness

python scripts/v2/tts_harness.py 配音文本 --output minimax-output

指定音色

python scripts/v2/run_pipeline.py gen 选题 --voice female-yujie

自动修复机制

  • - 确定性预检未通过 → 自动修复文本 → 重新生成(最多 3 轮)
  • 超过 3 轮 → 标记 needs_human=True,人工处理
  • 语义校验(Whisper)未通过 → 标记人工处理

Whisper 语义校验(可选,需安装):
bash
pip install openai-whisper

重新运行 Harness 时自动启用

Step 4: AI 视频片段(Hailuo)

bash

t2v(文生视频)— 知识/剧情场景


python skills/minimax-multimodal/scripts/video/generate_video.py \
--mode t2v \
--prompt medium shot, slow push-in, ... modern cinematic, 9:16 vertical \
--duration 6 \
--output minimax

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 videogen-1776021793 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 videogen-1776021793 技能

通过命令行安装

skillhub install videogen-1776021793

下载

⬇ 下载 videogen v2.2.0(免费)

文件大小: 369.73 KB | 发布时间: 2026-4-13 12:29

v2.2.0 最新 2026-4-13 12:29
视频号竖屏字体规范:72px标题/32px节点/20px标签 + 精简配色(#007AFF单一强调色) + 60px安全区

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部