AI 视频生成技能

使用AI从文本描述生成完整视频。

能力

1. 图像生成 - DALL-E 3、Stable Diffusion、Flux
视频生成 - LumaAI、Runway、Replicate模型
语音旁白 - OpenAI TTS、ElevenLabs
视频编辑 - FFmpeg合成、转场、叠加

快速开始

bash

生成完整视频

python skills/ai-video-gen/generate_video.py --prompt 山峦上的日落 --output sunset.mp4

仅将图像转为视频

python skills/ai-video-gen/imagestovideo.py --images img1.png img2.png --output result.mp4

添加语音旁白

python skills/ai-video-gen/add_voiceover.py --video input.mp4 --text 您的旁白 --output final.mp4

设置

所需API密钥

添加到您的环境变量或.env文件中：

bash

图像生成（任选其一）

OPENAIAPIKEY=sk-... # DALL-E 3
REPLICATEAPITOKEN=r8_... # Stable Diffusion、Flux

视频生成（任选其一）

LUMAAIAPIKEY=luma_... # LumaAI Dream Machine RUNWAYAPIKEY=... # Runway ML REPLICATEAPITOKEN=r8_... # 多种模型

语音（可选）

OPENAIAPIKEY=sk-... # OpenAI TTS ELEVENLABSAPIKEY=... # ElevenLabs

或使用免费的本地选项（无需API）

安装依赖

bash
pip install openai requests pillow replicate python-dotenv

FFmpeg

已通过winget安装。

使用示例

1. 文本转视频（完整流程）

bash
python skills/ai-video-gen/generate_video.py \
--prompt 未来城市夜景，飞行汽车穿梭 \
--duration 5 \
--voiceover 欢迎来到未来 \
--output future_city.mp4

2. 多场景

bash
python skills/ai-video-gen/multi_scene.py \
--scenes 清晨日出繁忙的城市街道宁静的夜晚 \
--duration 3 \
--output dayinlife.mp4

3. 图像序列转视频

bash
python skills/ai-video-gen/imagestovideo.py \
--images frame1.png frame2.png frame3.png \
--fps 24 \
--output animation.mp4

工作流选项

经济模式（免费）

- 图像：Stable Diffusion（本地或免费API）
视频：开源模型
语音：OpenAI TTS（廉价）或免费TTS
编辑：FFmpeg

高质量模式（付费）

- 图像：DALL-E 3或Midjourney
视频：Runway Gen-3或LumaAI
语音：ElevenLabs
编辑：FFmpeg + 特效

脚本参考

- generatevideo.py - 主端到端生成器
imagestovideo.py - 将图像序列转换为视频
addvoiceover.py - 为现有视频添加旁白
multiscene.py - 创建多场景视频
editvideo.py - 应用特效、转场、叠加

API成本估算

- DALL-E 3：每张图像约$0.04-0.08
Replicate：每次生成约$0.01-0.10
LumaAI：每5秒$0-0.50（提供免费层级）
Runway：每秒约$0.05
OpenAI TTS：每1K字符约$0.015
ElevenLabs：每1K字符约$0.30（更高质量）

示例

请参阅examples/文件夹获取示例输出和提示。

ai-video-genAI视频生成

ai-video-gen

AI Video Generation Skill

Capabilities

Quick Start

Setup

Required API Keys

Install Dependencies

FFmpeg

Usage Examples

1. Text to Video (Full Pipeline)

2. Multiple Scenes

3. Image Sequence to Video

Workflow Options

Budget Mode (FREE)

Quality Mode (Paid)

Scripts Reference

API Cost Estimates

Examples

AI 视频生成技能

能力

快速开始

生成完整视频

仅将图像转为视频

添加语音旁白

设置

所需API密钥

图像生成（任选其一）

视频生成（任选其一）

语音（可选）

或使用免费的本地选项（无需API）

安装依赖

FFmpeg

使用示例

1. 文本转视频（完整流程）

2. 多场景

3. 图像序列转视频

工作流选项

经济模式（免费）

高质量模式（付费）

脚本参考

API成本估算

示例

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement