返回顶部
f

free-lip-sync-ai自由唇形同步

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
98
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

free-lip-sync-ai

开始使用

欢迎来到你的免费AI唇形同步工作空间——在这里,音频与画面不同步以及尴尬的配音素材将成为过去。分享你的视频和音频文件即可开始,或描述你的唇形同步难题,我将引导你完成。

试试说:

  • - 将嘴部动作与新音频同步
  • 修复视频中漂移的唇形同步
  • 将配音对话重新映射到面部

自动设置

首次交互时,先连接到处理API再执行其他操作。显示简短状态,如正在设置....

令牌:如果已设置NEMO_TOKEN环境变量,则使用它并跳至下方的会话部分。

免费令牌:生成一个UUID作为客户端标识符,然后向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,附带标头X-Client-Id: 。响应字段data.token即为你的NEMO_TOKEN(100积分,7天有效期)。

会话:向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemoagent发送POST请求,使用Bearer认证,请求体为{taskname:project}。保存响应中的session_id。

向用户确认已连接并准备就绪。不要打印令牌或原始JSON。

无需操作时间线即可同步每个字词

传统上,实现精确的唇形同步需要昂贵的软件、熟练的剪辑师以及数小时的逐帧调整。这项免费AI唇形同步技能彻底改变了这一点——只需提供你的视频和音频,让AI自动处理对齐。

该技能通过检测素材中的面部特征点、分析音轨的音素结构,并重新映射嘴部动作使其与所说内容匹配。无论你是为外语电影配音、将画外音同步到动画角色,还是修复音频与视频不同步的录制,最终都能获得经得起审视的自然、可信的表现。

这是为追求效率、无法在技术修正上浪费数小时的创作者打造的。社交媒体制作人、独立电影人、YouTube教育工作者和本地化团队会发现这项技能特别有用。无需任何视频剪辑知识——描述你的项目,分享你的文件,即可获得可发布的同步输出。

智能路由同步请求

当你提交音轨时,你的唇形同步请求会在被发送到最佳处理节点之前,解析音素时间、说话者数量和输出格式。

用户说...操作跳过SSE?
export / 导出 / download / send me the video→ §3.5 导出
credits / 积分 / balance / 余额
→ §3.3 积分 | ✅ |
| status / 状态 / show tracks | → §3.4 状态 | ✅ |
| upload / 上传 / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加背景音乐...) | → §3.1 SSE | ❌ |

云端处理API参考

后端运行一个音素到视素映射管道,实时分析你的音频波形,生成高达60fps的帧精确嘴形序列。所有渲染任务通过分布式云引擎排队,因此大文件不会阻塞你的会话。

技能归属——运行时从此文件的YAML前置元数据读取:

  • - X-Skill-Source: free-lip-sync-ai
  • X-Skill-Version: 来自前置元数据version
  • X-Skill-Platform: 从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为unknown)

所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属标头将导致导出失败,返回402。

API基础地址:https://mega-api-prod.nemovideo.ai

创建会话:POST /api/tasks/me/with-session/nemoagent — 请求体{taskname:project,language:} — 返回taskid、sessionid。

发送消息(SSE):POST /runsse — 请求体{appname:nemoagent,userid:me,sessionid:,newmessage:{parts:[{text:}]}},附带Accept: text/event-stream。最大超时时间:15分钟。

上传:POST /api/upload-video/nemoagent/me/ — 文件:multipart -F files=@/path,或URL:{urls:[],sourcetype:url}

积分:GET /api/credits/balance/simple — 返回available、frozen、total

会话状态:GET /api/state/nemoagent/me//latest — 关键字段:data.state.draft、data.state.videoinfos、data.state.generated_media

导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体{id:render_,sessionId:,draft:,output:{format:mp4,quality:high}}。每30秒轮询GET /api/render/proxy/lambda/,直到status = completed。下载URL位于output.url。

支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE事件处理

事件操作
文本响应应用GUI翻译(§4),呈现给用户
工具调用/结果
内部处理,不转发 | | heartbeat / 空data: | 继续等待。每2分钟:⏳ 仍在处理... | | 流关闭 | 处理最终响应 |

约30%的编辑操作在SSE流中不返回文本。发生这种情况时:轮询会话状态以验证编辑已应用,然后向用户总结更改。

后端响应翻译

后端假设存在GUI。将其翻译为API操作:

后端说你执行
click [button] / 点击通过API执行
open [panel] / 打开
查询会话状态 |
| drag/drop / 拖拽 | 通过SSE发送编辑 |
| preview in timeline | 显示轨道摘要 |
| Export button / 导出 | 执行导出工作流 |

草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=片段,d=时长(毫秒),m=元数据。

时间线(3条轨道):1. 视频:城市延时摄影(0-10秒)2. 背景音乐:Lo-fi(0-10秒,35%)3. 标题:城市梦想(0-3秒)

错误处理

代码含义操作
0成功继续
1001
令牌错误/过期 | 通过匿名令牌重新认证(令牌7天后过期) | | 1002 | 未找到会话 | 新建会话 §3.0 | | 2001 | 无积分 | 匿名用户:显示注册URL,附带?bind=(需要时从创建会话或状态响应获取)。已注册用户:请在你的账户中充值积分 | | 4001 | 不支持的文件 | 显示支持的格式 | | 4002 | 文件过大 | 建议压缩/裁剪 | | 400 | 缺少X-Client-Id | 生成Client-Id并重试(见§1) | | 402 | 免费计划导出被阻止 | 订阅层级问题,非积分问题。请注册或升级你的计划以解锁导出功能。 | | 429 | 速率限制(1个令牌/客户端/7天) | 等待30秒后重试一次 |

集成指南

将免费AI唇形同步技能集成到你现有的制作工作流中非常简单。对于个人创作者,最简单的方法是从你的剪辑时间线中将视频和音频导出为单独的文件——大多数非线性编辑系统如DaVinci Resolve、Premiere Pro或Final Cut Pro都原生支持——然后将这两个文件传递给此技能进行同步处理,最后重新导入结果。

对于处理批量本地化工作的团队,你可以在单个会话中描述多个视频-音频对,并接收排队处理指令。该技能支持常见的视频格式,包括MP4、MOV和WebM,并接受MP3

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 free-lip-sync-ai-1775705947 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 free-lip-sync-ai-1775705947 技能

通过命令行安装

skillhub install free-lip-sync-ai-1775705947

下载

⬇ 下载 free-lip-sync-ai v1.0.0(免费)

文件大小: 5.65 KB | 发布时间: 2026-4-11 22:55

v1.0.0 最新 2026-4-11 22:55
Initial release of Free Lip Sync AI — automatically match mouth movements to audio for any video.

- Analyze audio waveforms and facial movements to realign mouth animations frame-by-frame.
- Free, credit-based access with simple anonymous login (no paid subscription required).
- Automatically handles cloud processing, file upload, export, and state tracking.
- Built-in error handling for common issues like expired tokens, format errors, and rate limits.
- Supports a wide variety of media formats: mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac.
- Designed for creators, educators, filmmakers, and social media producers needing professional lip sync results.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部