返回顶部
y

youtube-anycaption-summarizerYouTube字幕摘要

Turn YouTube videos into dependable markdown transcripts and polished summaries — even when caption coverage is messy. This skill works with manual closed captions (CC), auto-generated subtitles, or no usable subtitles at all by using subtitle-first extraction with local Whisper fallback. Supports private/restricted videos via cookies, batch processing, transcript cleanup, language backfill, source-language or user-selected summary language, and end-to-end completion reporting. Ideal for YouTube

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.3
安全检测
已通过
120
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

youtube-anycaption-summarizer

YouTube AnyCaption Summarizer

即使在字幕损坏、缺失或不一致的情况下,依然能正常工作的YouTube摘要工具。

输出:原始Markdown转录文本 + 精炼Markdown摘要 + 会话就绪结果块。

与仅依赖字幕的工具不同,当字幕缺失时,此技能会回退到本地Whisper转录,因此依然能正常工作。

从一个或多个YouTube视频生成原始转录Markdown文件和精炼摘要Markdown文件。

此技能是自包含的。它不需要任何其他YouTube摘要技能或先前的工作流上下文。

最佳适用场景

  • - 创始人视频、操作演示和技术讲解
  • 需要转录文本+实现摘要的长教程视频
  • 可能需要Cookie的私有/内部YouTube上传内容
  • 混合字幕环境:部分视频有CC字幕,部分仅有自动字幕,部分完全没有可用字幕
  • 需要批量处理多个YouTube链接并输出标准化Markdown的研究工作流
  • 希望获得可靠Markdown制品(而非一次性聊天摘要)的用户

为何选择此技能而非更简单的转录技能?

  • - 优先使用手动CC字幕,其次自动字幕,最后本地Whisper回退
  • 在字幕覆盖薄弱或缺失时仍能正常工作
  • 通过Cookie支持私有/受限YouTube视频
  • 返回持久的Markdown制品,而非仅聊天文本
  • 支持批量处理和会话就绪的完成报告

安装依赖

对于全新的macOS环境,新用户可直接复制粘贴以下命令:

bash
brew install yt-dlp ffmpeg whisper-cpp
MODELS_DIR=$HOME/.openclaw/workspace
MODELPATH=$MODELSDIR/ggml-medium.bin
mkdir -p $MODELS_DIR
if [ ! -f $MODEL_PATH ]; then
curl -L https://huggingface.co/ggerganov/whisper.cpp/resolve/main/ggml-medium.bin \
-o $MODELPATH.part && mv $MODELPATH.part $MODEL_PATH
else
echo 模型已存在于 $MODEL_PATH — 保持不变。
fi
command -v python3 yt-dlp ffmpeg whisper-cli
ls -lh $MODEL_PATH

上述操作的作用:

  • - 安装 yt-dlp、ffmpeg 和 whisper-cli
  • 如果默认模型目录不存在,则创建此技能使用的默认模型目录:~/.openclaw/workspace
  • 仅在默认Whisper模型文件缺失时下载
  • 避免修改 ~/.openclaw/openclaw.json 或任何其他OpenClaw配置文件
  • 不会删除、替换或覆盖现有工作区文件夹中的其他文件
  • 验证所需的二进制文件和模型文件是否存在

如果希望将模型存储在其他位置,运行工作流时请传递 --models-dir /path/to/models 参数。

示例请求

  • - 将此YouTube视频摘要为Markdown格式。
  • 为此YouTube链接生成转录文本和精炼摘要。
  • 使用我的浏览器Cookie处理此私有YouTube视频。
  • 批量摘要这些YouTube链接,并提供转录文本和摘要文件。
  • 有字幕时使用字幕,否则本地转录。
  • 为此英文YouTube视频创建中文摘要。

快速开始

单个视频

bash
python3 scripts/runyoutubeworkflow.py https://www.youtube.com/watch?v=VIDEO_ID

这将创建一个专用的每个视频文件夹,写入原始转录Markdown文件,创建摘要占位Markdown文件,并打印描述输出结果的JSON,以及完成摘要步骤所需的确切后续命令/提示。

重要提示:工作流脚本本身并非最终交付物。当前的OpenClaw会话仍需:

  1. 1. 如果工作流将语言留为 unknown,则推断/回填语言
  2. 用真实的精炼摘要覆盖占位符 Summary.md
  3. 运行 scripts/completeyoutubesummary.py 以验证/最终确定结果

强制简体中文摘要

bash
python3 scripts/runyoutubeworkflow.py https://www.youtube.com/watch?v=VIDEO_ID \
--summary-language zh-CN

使用Cookie的受限视频

bash
python3 scripts/runyoutubeworkflow.py https://www.youtube.com/watch?v=VIDEO_ID \
--cookies /path/to/cookies.txt

bash
python3 scripts/runyoutubeworkflow.py https://www.youtube.com/watch?v=VIDEO_ID \
--cookies-from-browser chrome

批量/队列模式

参见 references/batch-input-format.md。

bash
python3 scripts/runyoutubeworkflow.py --batch-file ./youtube-urls.txt

此技能的突出优势

此技能旨在应对YouTube的复杂现实情况,始终保持正常工作:

  • - 如果视频有手动CC字幕,优先使用
  • 如果仅有自动生成的字幕,则使用这些
  • 如果完全没有可用字幕,则回退到本地Whisper转录

这使得它比仅依赖字幕的工作流更加可靠。它适用于字幕丰富的视频、字幕稀少的视频以及字幕覆盖不一致的私有/内部上传内容。

核心能力:

  • - 首先获取YouTube元数据并推导出安全的输出路径
  • 支持单视频模式和批量/队列模式
  • 通过优先字幕提取配合本地Whisper回退,处理手动CC字幕、自动生成字幕或无字幕情况
  • 通过Cookie或浏览器Cookie提取支持受限/私有视频
  • 在摘要前对嘈杂的转录文本进行规范化
  • 创建摘要占位文件,用最终摘要覆盖,并完成端到端计时
  • 除非明确指示,否则仅清理工作流创建的已知中间文件

此技能的输出

为每个视频创建一个专用输出文件夹,包含以下最终交付物:

  • - SANITIZEDVIDEONAMEtranscriptraw.md
  • SANITIZEDVIDEONAME_Summary.md

默认情况下,仅删除工作流创建的已知中间媒体、字幕和WAV文件。不删除视频文件夹中可能已存在的无关文件。

所需的本地工具

运行工作流前请验证这些工具是否存在:

  • - yt-dlp
  • ffmpeg
  • whisper-cli
  • python3

工作流还要求在配置的模型目录中存在受支持的Whisper ggml模型文件。

捆绑脚本

直接使用以下脚本:

  • - scripts/runyoutubeworkflow.py — 用于元数据、下载/字幕、转录、占位摘要创建、清理和工作流元数据输出的主要确定性工作流
  • scripts/backfilldetectedlanguage.py — 在当前会话LLM确定主要转录语言后,更新 transcriptraw.md、Summary.md 和工作流元数据
  • scripts/completeyoutubesummary.py — 验证 Summary.md 不再是占位符,可选回填语言,计算单个项目的最终端到端计时报告,并输出会话就绪的结果块
  • scripts/normalizetranscripttext.py — 将带时间戳的原始转录文本转换为更干净的摘要输入,不修改原始转录文件
  • scripts/finalizeyoutubesummary.py — 完成流程使用的底层计时辅助工具
  • scripts/preparevideo_paths.py — 从标题和视频ID推导出经过净化的文件夹和输出文件路径

有用的参考资料:

  • - references/detailed-workflow.md — 完整的操作工作流、完成规则、批量指导、命名规则和实用说明
  • references/summary-template.md — 最终 Summary.md 所需的结构和编写规则
  • references/session-output-template.md — 完成后返回当前OpenClaw会话所需的面向用户的输出格式
  • references/batch-input-format.md — 队列/批量处理的输入格式

默认设置

  • - 默认父级输出文件夹:~/Downloads
  • 默认Whisper模型:ggml-medium
  • 支持的Whisper模型:ggml-base、ggml-small、ggml-medium
  • 默认媒体模式:仅音频
  • 默认转录语言:如需转录则自动检测
  • 默认摘要语言:source
  • 原始转录保留时间戳

公共工作流概述

从高层次来看,此技能执行以下操作:

  1. 1. 首先获取元数据并创建安全的输出路径
  2. 尝试手动字幕,然后自动字幕,最后本地Whisper回退
  3. 写入 SANITIZEDVIDEONAMEtranscriptraw.md
  4. 创建 SANITIZEDVIDEONAMESummary.md 作为占位符
  5. 让当前OpenClaw会话用真实摘要覆盖占位符
  6. 运行 scripts/completeyoutube_summary.py 以验证完成情况,必要时回填语言,并输出会话就绪的结果块

完成标准

对于正常的端到端请求,完成意味着以下所有条件均满足:

  1. 1. 工作流脚本成功运行
  2. 如果语言最初为 unknown,则语言已回填到两个Markdown文件中
  3. 占位摘要文件已被真实摘要覆盖

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 youtube-anycaption-summarizer-1775997724 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 youtube-anycaption-summarizer-1775997724 技能

通过命令行安装

skillhub install youtube-anycaption-summarizer-1775997724

下载

⬇ 下载 youtube-anycaption-summarizer v1.1.3(免费)

文件大小: 27.73 KB | 发布时间: 2026-4-13 12:40

v1.1.3 最新 2026-4-13 12:40
Docs safety update: dependency setup now clearly avoids overwriting the workspace folder, OpenClaw config, or an existing ggml-medium model file.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部