返回顶部
v

video-knowledge-ingest视频知识摄取

Ingest and summarize cross-platform videos into a local knowledge base. Use when working with YouTube, Bilibili, Xiaohongshu, or local media/subtitle files and you need to fetch subtitles when available, fall back to yt-dlp download + ffmpeg + Whisper transcription when subtitles are missing, generate a text summary, and save transcript/summary/metadata into local files. Also use when packaging this workflow for sub-agents or debugging failures such as subtitle 429s, Bilibili share-link 403s, Yo

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
180
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

video-knowledge-ingest

视频知识摄取

使用此技能作为默认的跨平台视频→转录→摘要→本地知识工作流。

快速开始

  1. 1. 运行捆绑的入口点:
- skills/video-knowledge-ingest/scripts/video-ingest.sh
  1. 2. 读取JSON标准输出以获取路径。
  2. 将summary.md中的摘要发送回用户。
  3. 将存储的文件保留在本地知识库中;除非被要求,否则不要移动它们。

默认知识库根目录:

  • - /home/jason/.openclaw/workspace/knowledge/video-notes/

此技能调用的内容

正常路径中的核心工具:

  • - yt-dlp — 解析元数据、获取字幕或下载媒体
  • ffmpeg / ffprobe — 在转录前标准化音频
  • 捆绑的scripts/whisper-gpu.sh — 使用工作区GPU虚拟环境进行本地Whisper转录
  • summarize --cli codex — 生成最终书面摘要
  • 本地文件系统 — 持久化存储转录、摘要、元数据和索引条目

平台特定说明:

  • - YouTube:优先使用可用字幕;回退到媒体下载 + Whisper
  • Bilibili:通常回退到Whisper;脚本自动将bilibili.com/...标准化为www.bilibili.com/...并去除spm_跟踪参数
  • 小红书:通常没有字幕;预期媒体下载 + Whisper
  • 本地字幕/文本文件:跳过下载,直接进行摘要
  • 本地媒体文件:跳过yt-dlp;直接进入Whisper

工作流程

1. 标准化源

  • - 如果输入是URL,使用捆绑的标准化器。
  • 保留YouTube时间参数(t、start、list、index),但丢弃常见的跟踪参数。
  • 对于Bilibili,强制使用www.bilibili.com并移除spm_*查询参数。

2. 优先尝试字幕

  • - 以仅字幕模式运行yt-dlp。
  • 优先选择zh.和en.字幕。
  • 将字幕下载视为尽力而为
  • 如果有任何可用的.srt/.vtt文件落地,即使另一个字幕变体返回非零退出码,也继续使用该文件。

3. 回退到媒体 + Whisper

如果没有可用的字幕落地:

  • - 使用yt-dlp下载最佳音频/媒体
  • 使用捆绑的scripts/whisper-gpu.sh进行转录
  • 如果GPU转录失败,脚本会自动回退到CPU

4. 生成摘要

  • - 使用summarize --cli codex --force-summary对生成的转录进行摘要
  • 预期codex已安装并登录,或者在使用前以其他方式配置摘要后端

5. 持久化结果

对于每个摄取的项目,保留以下文件:

  • - source.url 或 source.path
  • source.info.json
  • downloads/(当获取远程媒体/字幕时)
  • whisper/(当使用Whisper时)
  • transcript.txt
  • summary.md
  • record.json
  • 全局追加索引:knowledge/video-notes/index.jsonl

常用命令

远程URL:
bash
skills/video-knowledge-ingest/scripts/video-ingest.sh https://www.youtube.com/watch?v=...
skills/video-knowledge-ingest/scripts/video-ingest.sh https://bilibili.com/video/BV...
skills/video-knowledge-ingest/scripts/video-ingest.sh https://www.xiaohongshu.com/explore/...

本地文件:
bash
skills/video-knowledge-ingest/scripts/video-ingest.sh /path/to/file.srt
skills/video-knowledge-ingest/scripts/video-ingest.sh /path/to/file.mp4

自定义输出根目录:
bash
skills/video-knowledge-ingest/scripts/video-ingest.sh --kb-root /some/other/root

何时阅读捆绑的参考文档

当您需要以下内容时,阅读references/toolchain.md:

  • - 依赖项详细信息
  • 精确的文件布局
  • 每个工具在管道中的使用方式

当您遇到以下问题时,阅读references/troubleshooting.md:

  • - YouTube反爬虫/ Cookie问题
  • Bilibili共享链接的403错误
  • 字幕429 / 部分字幕失败
  • 小红书字幕缺失
  • summarize / codex认证失败
  • Whisper虚拟环境、CUDA、ffmpeg或yt-dlp问题

操作规则

  • - 优先使用捆绑的scripts/video-ingest.sh入口点,而不是重新实现工作流程。
  • 除非明确要求,否则不要跳过本地知识库写入。
  • 当运行失败时,在宣布完全失败之前检查生成的目录;部分工件通常能解释真正的问题。
  • 如果平台提供字幕,优先使用它们而不是Whisper。
  • 如果字幕缺失或不可用,自动回退到媒体 + Whisper。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 video-knowledge-ingest-1776277322 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 video-knowledge-ingest-1776277322 技能

通过命令行安装

skillhub install video-knowledge-ingest-1776277322

下载

⬇ 下载 video-knowledge-ingest v1.0.0(免费)

文件大小: 12.75 KB | 发布时间: 2026-4-17 16:28

v1.0.0 最新 2026-4-17 16:28
Initial release of video-knowledge-ingest skill.

- Ingests and summarizes videos from YouTube, Bilibili, Xiaohongshu, or local files into a local knowledge base.
- Fetches subtitles if available; otherwise downloads media and transcribes using Whisper.
- Generates a text summary and saves transcript, summary, and metadata locally.
- Handles edge cases including subtitle errors, platform-specific issues, and dependency problems.
- Intended as the default video-to-summary workflow and for debugging ingestion failures.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部