返回顶部
b

byted-mediakit-voiceover-editing字节媒体配音编辑

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.9
安全检测
已通过
216
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

byted-mediakit-voiceover-editing

一、模式与凭据

1.1 三种执行模式

模式说明所需环境变量ASR 方式
apigSkillHub 网关代理,Bearer Token 认证ARKSKILLAPIBASE + ARKSKILLAPIKEY(容器注入)+ VOLCSPACENAME + ASRAPIKEY + ASRBASEURL豆包语音大模型
cloud
直连火山引擎 OpenAPI,HMAC 签算 | VOLCACCESSKEYID + VOLCACCESSKEYSECRET + VOLCSPACENAME + ASRAPIKEY + ASRBASEURL | 豆包语音大模型 | | local | 完全本地执行,无需云端服务 | 无(可选 EXECUTION_MODE=local) | Qwen3-ASR 本地推理 |

优先级:apig > cloud > local。自动检测按此顺序依次检查环境变量,缺参时打印 .env 路径与缺失变量列表并自动降级。

1.2 凭据配置

  • - .env 文件位置DIR>/.env
  • 脚本先读进程环境变量,再用 .env 补全未设置的项(不覆盖容器注入)
  • ARKSKILL_* 通常由部署容器注入,不必手写到 .env
  • 缺参不阻塞:不使用终端 input() 交互,缺参时打印提示信息并自动降级到可用模式
  • Agent 推荐用户通过编辑 .env 文件Agent 文件写入工具来配置变量,避免终端粘贴问题
  • 安全:控制台创建仅含所需权限的密钥;测试请用独立点播空间;.env 勿提交仓库

1.3 模式意图识别(Agent 必读)

当用户在对话中表达模式切换意图时,Agent 应识别并执行:

用户表达识别为操作
用本地模式 / 不走云端 / 离线处理EXECUTIONMODE=local写入 .env 或传 --mode local
用云端 / 用火山引擎 / 走 AK/SK
EXECUTIONMODE=cloud | 写入 .env 或传 --mode cloud |
| 走网关 / 用 apig / 用 SkillHub | EXECUTION_MODE=apig | 写入 .env 或传 --mode apig |

隔离要求:各任务的模式选择相互独立。一个任务中切换到 local 不应影响另一个任务的模式。Agent 应在每次任务开始时重新检测或遵循用户当次指定。



二、执行约束(严格 — 无例外)

  1. 1. 仅使用以下脚本,禁止创建新脚本
  2. 按顺序执行所有步骤,跳步即任务失败
  3. 执行任何脚本前必须先 cd DIR>/scripts
  4. 每个检查点必须验证产物后再继续
  5. 任何步骤失败必须立即停止并报告,不得继续
  6. 步骤 4/5/6 输出禁止简化版、占位符、示例或省略内容
  7. 最终输出必须保持原样,不能做任何修改
  8. 审核页是否自动打开由 TALKINGVIDEOAUTOEDITREVIEWAUTO_OPEN 决定(强制):Agent 不得额外执行 open/start/xdg-open 等命令
  9. 超时设置:音视频处理时长较长,宿主超时时间应设置为 60 分钟

职责分工

组件职责不做
脚本(规则引擎)ASR 优化、候选生成(标记位置+规则置信度+删除建议)不做最终删除/保留决策
宿主 Agent(你)
语义断句、口癖识别确认、候选复核、最终删除/保留决策 | 不修改脚本 |

核心原则:脚本提供候选(含 deletedparts + cleanedtext),Agent 做最终决策。



三、路径规则

3.1 SKILL_DIR 与输出目录

  • - SKILLDIR:byted-mediakit-voiceover-editing 目录路径
  • PROJECTROOT:由 scripts/project_paths.py 推导:
1. 环境变量 VOICEOVEREDITINGPROJECT_ROOT 若设置则用之 2. 否则为 的 parents[2](沿父链上移 3 级,不依赖中间目录命名)
  • - 输出目录/output/<素材名>/
  • 脚本启动时会打印路径推导日志,便于调试确认

3.2 素材名推导

来源推导规则示例
URL取最后一段去扩展名https://x.com/video.mp4 → video
本地文件
取文件名去扩展名 | /path/TestVideo720p.mp4 → TestVideo720p | | DirectUrl | 取 FileName 去扩展名 | test.mp4 → test | | Vid | 取 Vid 值 | v0xxx → v0xxx |

3.3 从上下文推导输出目录

  • - 推导优先级(按顺序尝试):
1. 对话历史/命令参数中已显式传入 --output-dir output/<子目录> → 直接沿用 2. 无法从对话历史获得 → 询问用户指定
  • - Agent 不得扫描仓库来推断 output-dir

3.4 重复处理

写入任何输出文件/目录前,若目标已存在,必须提示用户

  • - 目录已存在:「是否删除原目录?[删除/保留并新建(01)]」
  • 文件已存在:「是否删除/覆盖/保留?」
  • 超时 20 秒默认「保留并新建(01)」



四、脚本清单

执行前必须 cd /scripts

脚本用途
./scripts/setup.sh环境检查与依赖安装
./scripts/pipelineurlto_asr.py
步骤 3: URL → ASR 流水线(支持 --mode local/cloud/apig) | | ./scripts/mergeasrwords.py | 步骤 4 产出缺 words 时,从 raw 合并 | | ./scripts/prepareexportdata.py | 步骤 6a: 数据预处理(--width --height --write-step6) | | ./scripts/servereviewpage.py | 步骤 6b: 审核页静态服务 + 数据保存 + 导出代理 | | ./scripts/export_server.py | 导出服务(独立进程,接收审核页 POST) | | ./scripts/voddirectexport.py | 步骤 6c: VOD 导出任务提交与查询 |

五、必经步骤

各步骤完整检查单见 references/执行步骤/ 下分步文档。

步骤说明文档
步骤 1环境检查与依赖安装1. 环境检查.md
步骤 2
语气词/卡顿词确认与规则更新 | 2. 语气词提示与用户行为更新.md | | 步骤 3 | URL → ASR 流水线与候选生成 | 3. URL到ASR流水线与候选生成.md | | 步骤 4 | ASR 语义纠错(Agent 执行) | 4. ASR语义纠错.md | | 步骤 5 | 口播剪辑(Agent 执行) | 5. 口播剪辑.md | | 步骤 5.5 | 审核逻辑确认 | 5.5 审核逻辑确认.md | | 步骤 6a | 数据预处理 | 6a. 数据预处理.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 byted-mediakit-voiceover-editing-1775984849 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 byted-mediakit-voiceover-editing-1775984849 技能

通过命令行安装

skillhub install byted-mediakit-voiceover-editing-1775984849

下载

⬇ 下载 byted-mediakit-voiceover-editing v1.0.9(免费)

文件大小: 161.63 KB | 发布时间: 2026-4-13 09:37

v1.0.9 最新 2026-4-13 09:37
Version 1.0.9 adds full support for multi-mode (local/cloud/apig) execution of talking-head video editing, with flexible credential handling and path management.

- Added new environment variables and logic to support 3 execution modes: apig (SkillHub), cloud (Volcano Engine OpenAPI), and local (offline, no cloud needed).
- Introduced scripts for local processing: ASR, denoise, AV separation, media handling, and subtitle processing.
- Enhanced mode auto-detection with credential fallback and explicit .env control; "mode switch" commands by user are now supported.
- Revised project root and output directory resolution via new script, with clearer user prompts before overwriting outputs.
- Step-by-step flow, script list, and product file mapping have been updated in documentation.
- Security and separation of credential scope further emphasized.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部