Volcengine AI MediaKit

前置条件

- Python：确认 python --version ≥ 3.6
环境变量（必需，也可通过工作目录下的 .env 文件配置，脚本会自动加载）：

- VOLCENGINE_ACCESS_KEY — 火山引擎 Access Key - VOLCENGINE_SECRET_KEY — 火山引擎 Secret Key - VOD_SPACE_NAME — VOD 空间名称

- 依赖：脚本依赖 python-dotenv requests INLINECODE7

参数传入方式

所有脚本支持两种 JSON 参数传入方式：

1. 内联 JSON（适合简单参数）：INLINECODE8
文件引用（推荐，避免 shell 转义问题）：INLINECODE9

INLINECODE10 前缀表示从文件读取 JSON 内容，文件路径相对于当前工作目录。

结果交付规则

- 提交异步任务成功后会返回异步任务id，字段为 VCCreativeId 或 TaskId，在给用户交付最终产物时，必须包含异步任务id
在展示最终产物链接时，禁止随意修改链接内容
优先将产物链接提供给用户

注意

当用户询问当前 Skill 有什么能力时，直接返回 references/00-detail.md 的内容，并停止后续流程，等待用户输入。

工作流程

1) 识别输入视频类型（必要时先上传拿 `vid://...`）

后续所有处理脚本优先使用 VOD 侧资源引用：

- Vid：vid://vxxxx（或部分脚本接受裸 vxxxx 并自动补 vid://）
DirectUrl / FileName：directurl://<vod_file_name>（媒体类任务用 DirectUrl 时会要求 FileName + SpaceName）

当用户提供的是以下输入之一，需要先执行上传逻辑，拿到 Vid 后再继续：

- 本地文件路径：如 INLINECODE22
INLINECODE23 链接：如 https://example.com/a.mp4（会走 URL 拉取上传，并轮询上传结果）

统一用 scripts/upload_media.py：

CODEBLOCK0

脚本输出中 Source 字段即 vid://...，可直接作为后续处理输入。

安全限制：本地文件上传仅允许 workspace/、userdata/ 和 /tmp 目录下的文件。

2) 识别用户意图 → 选择对应处理脚本

根据用户需求，按以下决策树选择脚本：

用户意图	脚本
多个视频/音频合成一个（顺序拼接）	INLINECODE28
截取视频/音频的某个时间片段

3) 构造参数并执行

视频编辑类

脚本	用途	详细参数
INLINECODE56	视频/音频拼接	references/01-stitching.md
INLINECODE57

媒体处理类

脚本	用途	详细参数
INLINECODE65	人声分离	references/10-voice-separation.md
INLINECODE66

AI 内容分析类

脚本	用途	详细参数
INLINECODE70	语音识别 ASR	references/15-asr-speech-to-text.md
INLINECODE71

AI 内容生成类

脚本	用途	详细参数
INLINECODE79	AI 漫剧转绘	references/22-comic-style.md
INLINECODE80

重启轮询

脚本	用途
INLINECODE83	重启编辑类任务轮询
INLINECODE84

重启媒体处理类任务轮询 | | poll_translation.py <ProjectId> | 重启翻译任务轮询 |

超时响应中的 resume_hint.command 字段包含可直接复制执行的重启命令。

示例

CODEBLOCK1

错误输出

所有错误统一格式：INLINECODE87

超时输出（含重启指令）：
CODEBLOCK2

约束

- 调用脚本前必须查看脚本详细参数说明

计费说明

仅当用户主动咨询费用或计费规则时，再参考 references/00-billing-instructions.md 中的计费说明，向用户简要说明 volcengine-ai-mediakit 所依赖的 VOD 资源的计费构成，避免在普通剪辑/处理对话中主动展开计费细节。

Volcengine AI MediaKit

前置条件

- Python：确认 python --version ≥ 3.6
环境变量（必需，也可通过工作目录下的 .env 文件配置，脚本会自动加载）：

- VOLCENGINEACCESSKEY — 火山引擎 Access Key - VOLCENGINESECRETKEY — 火山引擎 Secret Key - VODSPACENAME — VOD 空间名称

- 依赖：脚本依赖 python-dotenv requests urllib

参数传入方式

所有脚本支持两种 JSON 参数传入方式：

1. 内联 JSON（适合简单参数）：python script.py {key:value}
文件引用（推荐，避免 shell 转义问题）：python script.py @params.json

@ 前缀表示从文件读取 JSON 内容，文件路径相对于当前工作目录。

结果交付规则

- 提交异步任务成功后会返回异步任务id，字段为 VCCreativeId 或 TaskId，在给用户交付最终产物时，必须包含异步任务id
在展示最终产物链接时，禁止随意修改链接内容
优先将产物链接提供给用户

注意

当用户询问当前 Skill 有什么能力时，直接返回 references/00-detail.md 的内容，并停止后续流程，等待用户输入。

工作流程

1) 识别输入视频类型（必要时先上传拿 vid://...）

后续所有处理脚本优先使用 VOD 侧资源引用：

- Vid：vid://vxxxx（或部分脚本接受裸 vxxxx 并自动补 vid://）
DirectUrl / FileName：directurl://filename>（媒体类任务用 DirectUrl 时会要求 FileName + SpaceName）

当用户提供的是以下输入之一，需要先执行上传逻辑，拿到 Vid 后再继续：

- 本地文件路径：如 /path/to/a.mp4
http/https 链接：如 https://example.com/a.mp4（会走 URL 拉取上传，并轮询上传结果）

统一用 scripts/upload_media.py：

bash
python DIR>/scripts/uploadmedia.py filepathorhttpurl> [spacename]

脚本输出中 Source 字段即 vid://...，可直接作为后续处理输入。

安全限制：本地文件上传仅允许 workspace/、userdata/ 和 /tmp 目录下的文件。

2) 识别用户意图 → 选择对应处理脚本

根据用户需求，按以下决策树选择脚本：

用户意图	脚本
多个视频/音频合成一个（顺序拼接）	stitching
截取视频/音频的某个时间片段

3) 构造参数并执行

视频编辑类

脚本	用途	详细参数
stitching.py <json>	视频/音频拼接	references/01-stitching.md
clipping.py <json>

volcengine-ai-mediakit火山引擎AI音视频处理