返回顶部
v

volcengine-ai-mediakit火山引擎AI音视频处理

火山引擎 AI MediaKit 音视频处理 Skill。当用户需要对音视频进行加工处理时触发。处理完成后自动查询任务状态并返回产物播放链接。核心能力分为七类:1. 视频处理:多片段拼接、片段裁剪、画面翻转、视频播放调速、音频播放调速、图片合成视频、音画合成、提取音轨、音频混音; 2. 音频处理:人声/伴奏分离、音频降噪; 3. 视频增强:综合画质修复、AI 超分、智能插帧; 4. 字幕处理:语音转字幕(ASR)、画面文字提取(OCR)、硬字幕擦除、添加内嵌字幕; 5. 智能分析:智能场景切分、人像抠图、绿幕抠图; 6. AI 创作:AI 视频翻译(声影智译)、短剧高光剪辑、AI 剧本还原、AI 解说视频生成、AI 漫剧转绘。 7. 媒资查询:获取媒资信息及播放地址(支持批量)。触发关键词:视频拼接、视频裁剪、视频剪辑、视频变速、视频翻转、图片转视频、音视频合成、提取音频、混音、人声分离、背景音分离、音频降噪、去噪、AI超分、超分辨率、画质修复、画质增强、智能补帧、视频插帧、提高帧率、语音转字幕、语音识别、ASR、OCR、文字提取、字幕擦除、去字幕、添加字幕、内嵌字幕、SRT字幕、智能

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.4
安全检测
已通过
570
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

volcengine-ai-mediakit

Volcengine AI MediaKit


前置条件

  • - Python:确认 python --version ≥ 3.6
  • 环境变量(必需,也可通过工作目录下的 .env 文件配置,脚本会自动加载):
- VOLCENGINEACCESSKEY — 火山引擎 Access Key - VOLCENGINESECRETKEY — 火山引擎 Secret Key - VODSPACENAME — VOD 空间名称
  • - 依赖:脚本依赖 python-dotenv requests urllib

参数传入方式

所有脚本支持两种 JSON 参数传入方式:

  1. 1. 内联 JSON(适合简单参数):python script.py {key:value}
  2. 文件引用(推荐,避免 shell 转义问题):python script.py @params.json

@ 前缀表示从文件读取 JSON 内容,文件路径相对于当前工作目录。



结果交付规则


  • - 提交异步任务成功后会返回异步任务id,字段为 VCCreativeId 或 TaskId,在给用户交付最终产物时,必须包含异步任务id
  • 在展示最终产物链接时,禁止随意修改链接内容
  • 优先将产物链接提供给用户



注意


当用户询问当前 Skill 有什么能力时,直接返回 references/00-detail.md 的内容,并停止后续流程,等待用户输入。


工作流程

1) 识别输入视频类型(必要时先上传拿 vid://...)

后续所有处理脚本优先使用 VOD 侧资源引用

  • - Vid:vid://vxxxx(或部分脚本接受裸 vxxxx 并自动补 vid://)
  • DirectUrl / FileName:directurl://filename>(媒体类任务用 DirectUrl 时会要求 FileName + SpaceName)

当用户提供的是以下输入之一,需要先执行上传逻辑,拿到 Vid 后再继续:

  • - 本地文件路径:如 /path/to/a.mp4
  • http/https 链接:如 https://example.com/a.mp4(会走 URL 拉取上传,并轮询上传结果)

统一用 scripts/upload_media.py:

bash
python DIR>/scripts/uploadmedia.py filepathorhttpurl> [spacename]

脚本输出中 Source 字段即 vid://...,可直接作为后续处理输入。

安全限制:本地文件上传仅允许 workspace/、userdata/ 和 /tmp 目录下的文件。

2) 识别用户意图 → 选择对应处理脚本

根据用户需求,按以下决策树选择脚本:

用户意图脚本
多个视频/音频合成一个(顺序拼接)stitching
截取视频/音频的某个时间片段
clipping |
| 加速/慢放/变速 | speedup |
| 镜像/上下翻转/左右翻转 | flip |
| 多张图片串联生成视频 | imagetovideo |
| 替换/叠加视频的背景音乐 | compile |
| 只要视频里的音频轨 | extract_audio |
| 多条音频同时叠加播放(混音) | mix_audios |
| 分离人声和伴奏/背景音 | voice_separation |
| 去除环境噪音/电流杂音/风噪 | noise_reduction |
| 模糊/低画质视频修复(压缩伪影/噪点/划痕) | quality_enhance |
| 低分辨率视频提升(如 720P→1080P) | super_resolution |
| 低帧率视频插帧提升流畅度(如 30fps→60fps) | interlacing |
| 语音识别/ASR/提取视频中的文字对白 | asrspeechto_text |
| OCR 文字提取/识别视频中的屏幕文字 | ocrtextextract |
| 擦除视频硬字幕 | subtitle_removal |
| 给视频添加/嵌入字幕(烧录字幕) | add_subtitle |
| 视频场景分割/智能切片 | intelligent_slicing |
| 人像抠图/人像分割 | portrait_matting |
| 绿幕抠像/绿屏抠像 | green_screen |
| AI 漫剧转绘(漫画风/3D卡通风格) | comic_style |
| 短剧高光剪辑/精彩片段提取 | highlight |
| AI 视频翻译(字幕/语音/面容翻译) | video_translation |
| 查询翻译项目状态/重启翻译轮询 | poll_translation |
| 查询翻译项目列表 | list_translation |
| AI 解说视频生成(短剧解说/二创) | drama_recap |
| AI 剧本还原(视频转结构化剧本) | drama_script |
| 查询媒资信息(Vid 详情+播放地址) | getmediainfo |

3) 构造参数并执行

视频编辑类

脚本用途详细参数
stitching.py <json>视频/音频拼接references/01-stitching.md
clipping.py <json>
视频/音频裁剪 | references/02-clipping.md | | flip.py | 视频翻转 | references/03-flip.md | | speedup.py video | 视频变速 | references/04-speedup.md | | speedup.py audio | 音频变速 | references/04-speedup.md | | imagetovideo.py | 图片转视频 | references/05-image-to-video.md | | compile.py | 音视频合成 | references/06-compile.md | | extractaudio.py | 提取音轨 | references/07-extract-audio.md | | mixaudios.py | 混音 | references/08-mix-audios.md |

媒体处理类

脚本用途详细参数
voiceseparation.py <json>人声分离references/10-voice-separation.md
noisereduction.py <json>
音频降噪 | references/11-noise-reduction.md | | qualityenhance.py | 综合画质修复 | references/12-quality-enhance.md | | superresolution.py | AI 超分辨率 | references/13-super-resolution.md | | interlacing.py | 智能补帧 | references/14-interlacing.md |

AI 内容分析类

脚本用途详细参数
asrspeechtotext.py <json>语音识别 ASRreferences/15-asr-speech-to-text.md
ocrtextextract.py <json>
OCR 文字提取 | references/16-ocr-text-extract.md | | subtitleremoval.py | 硬字幕擦除 | references/17-subtitle-removal.md | | addsubtitle.py | 添加嵌入字幕 | references/18-add-subtitle.md | | intelligentslicing.py | 智能场景分割 | references/19-intelligent-slicing.md | | portraitmatting.py | 人像抠图 | references/20-portrait-matting.md | | greenscreen.py | 绿幕抠像 | references/21-green-screen.md | | highlight.py | 短剧高光剪辑

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 volcengine-ai-mediakit-1776063307 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 volcengine-ai-mediakit-1776063307 技能

通过命令行安装

skillhub install volcengine-ai-mediakit-1776063307

下载

⬇ 下载 volcengine-ai-mediakit v1.0.4(免费)

文件大小: 101.92 KB | 发布时间: 2026-4-17 16:30

v1.0.4 最新 2026-4-17 16:30
- 新增 references/00-detail.md 文档,集中展示 Skill 全部能力明细。
- SKILL.md 增补说明:当用户询问当前 Skill 有什么能力时,直接返回 00-detail.md 内容,不再执行后续处理,提升易用性。
- 其余未发生功能变更。

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large