返回顶部
a

aliyun-videoretalk阿里云视频口型同步

Use when replacing lip sync in existing videos with Alibaba Cloud Model Studio VideoRetalk (`videoretalk`). Use when creating dubbed videos, replacing narration, or synchronizing a talking-head video to a new speech track.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
115
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

aliyun-videoretalk

技能名称: aliyun-videoretalk

详细描述:
类别: provider

Model Studio VideoRetalk

验证

bash
mkdir -p output/aliyun-videoretalk
python -m pycompile skills/ai/video/aliyun-videoretalk/scripts/prepareretalkrequest.py && echo pycompile_ok > output/aliyun-videoretalk/validate.txt

通过标准:命令退出码为0,且生成 output/aliyun-videoretalk/validate.txt 文件。

输出与证据

  • - 将标准化请求负载、目标人脸选择设置以及任务轮询快照保存到 output/aliyun-videoretalk/ 目录下。
  • 记录确切的视频/音频输入URL,以及是否启用了 video_extension。

当输入已为人像视频,且任务是用新的语音轨道替换唇形同步时,请使用VideoRetalk。

关键模型名称

使用以下确切的模型字符串:

  • - videoretalk

前提条件

  • - 该模型目前仅支持中国大陆(北京)区域。
  • API仅支持HTTP异步调用;没有在线控制台体验。
  • 在环境中设置 DASHSCOPEAPIKEY,或者将 dashscopeapikey 添加到 ~/.alibabacloud/credentials 文件中。

标准化接口 (video.retalk)

请求

  • - model (字符串,可选):默认为 videoretalk
  • videourl (字符串,必填)
  • audiourl (字符串,必填)
  • refimageurl (字符串,可选):当输入视频包含多张人脸时,用于指定目标人脸
  • videoextension (布尔值,可选):扩展视频以匹配更长的音频
  • queryface_threshold (整数,可选):取值范围 120 到 200

响应

  • - taskid (字符串)
  • taskstatus (字符串)
  • video_url (字符串,任务完成时返回)
  • usage (对象,可选)

端点与执行模型

  • - 提交任务:POST https://dashscope.aliyuncs.com/api/v1/services/aigc/image2video/video-synthesis/
  • 轮询任务:GET https://dashscope.aliyuncs.com/api/v1/tasks/{task_id}
  • HTTP调用仅为异步,且必须设置请求头 X-DashScope-Async: enable。

快速开始

bash
python skills/ai/video/aliyun-videoretalk/scripts/prepareretalkrequest.py \
--video-url https://example.com/talking-head.mp4 \
--audio-url https://example.com/new-voice.wav \
--video-extension

操作指南

  • - 确保输入视频为正面拍摄且距离足够近,以保证稳定的面部追踪。
  • 如果视频包含多张人脸,请提供 refimageurl 以锁定目标人物。
  • 如果新音频比输入视频长,请明确决定是扩展画面轨道还是截断音频。
  • URL必须是公开的HTTP/HTTPS链接;API不接受本地文件路径。

输出位置

  • - 默认输出:output/aliyun-videoretalk/request.json
  • 可通过 OUTPUT_DIR 覆盖基础目录。

参考资料

  • - references/sources.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 aliyun-videoretalk-1775882221 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 aliyun-videoretalk-1775882221 技能

通过命令行安装

skillhub install aliyun-videoretalk-1775882221

下载

⬇ 下载 aliyun-videoretalk v1.0.0(免费)

文件大小: 3.37 KB | 发布时间: 2026-4-12 08:58

v1.0.0 最新 2026-4-12 08:58
- Initial release of the aliyun-videoretalk skill for Alibaba Cloud Model Studio VideoRetalk.
- Enables automated lip sync replacement in person videos with new speech tracks.
- Supports video and audio input URLs, multi-face selection, and optional video extension.
- Outputs all request payloads, settings, and process snapshots for transparency.
- Async-only API with polling, requiring an API key and public media URLs.
- Includes operational guidance for best results and troubleshooting.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部