返回顶部
a

ai-podcast-pipelineAI播客流水线

Create Korean AI podcast packages from QuickView trend notes. Use for dual-host script writing (Callie × Nick), Gemini multi-speaker TTS audio generation, subtitle timing/render fixes, thumbnail+MP4 packaging, and YouTube title/description output. Supports both full (15~20 min) and compressed (5~7 min) editions.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.5
安全检测
已通过
1,350
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ai-podcast-pipeline

AI播客流水线

⚠️ 安全须知

该技能可能因以下合法用途触发杀毒软件误报:

  • - base64解码:仅用于解码Gemini TTS API响应中的音频数据(JSON中二进制数据的标准做法)
  • 子进程调用:仅用于调用ffmpeg进行音频/视频处理
  • 环境变量:从用户配置的环境中读取API密钥(GEMINIAPIKEY)
  • 网络请求:调用Google Gemini API进行文本转语音生成

所有代码均为开源,可在本仓库中审计。无恶意行为。

从Trend/QuickView-*内容构建端到端播客资产。

核心工作流

  1. 1. 选择源QuickView文件。
  2. 生成脚本(完整或压缩模式)。
  3. 构建双语音MP3(Gemini多说话人,分块处理以确保可靠性)。
  4. 生成全文本韩语字幕(无省略号截断)。
  5. 渲染带字幕的MP4(调整字体/大小/时间偏移)。
  6. 构建缩略图+YouTube元数据。
  7. 交付最终包。

步骤1) 选择源

优先选择配置的Quartz根目录中的周度QuickView文件。

如果用户提供wk.aiee.app URL,先映射到本地Quartz markdown文件。

步骤2) 生成脚本

读取并应用:

  • - references/podcastprompttemplate_ko.md

模式:

  • - 完整模式:15~20分钟
  • 压缩模式:5~7分钟(仅核心要点)

规则:

  • - 口语对话中不包含系统/元文本
  • 主持人开场介绍仅在开头出现一次
  • 对话式韩语,短句,可操作性强
  • 脚本保存至archive/

步骤3) 构建音频(Gemini多说话人,可靠)

推荐:分块构建器(超时安全)

bash

通过环境变量设置API密钥(必需)

export GEMINIAPIKEY=

从skills/ai-podcast-pipeline/目录运行

python3 scripts/builddualvoiceaudio.py \ --input \ --outdir \ --basename podcastfulldualvoice \ --chunk-lines 6

单次处理(短脚本)

bash python3 scripts/geminimultispeakertts.py \ --input-file \ --outdir \ --basename podcast_dualvoice \ --retries 3 \ --timeout-seconds 120

默认语音映射(2026-02-10固定):

  • - Callie(女声)→ Kore
  • Nick(男声)→ Puck

输出:MP3(默认交付格式)

步骤4) 构建韩语字幕(全文本)

使用全文本字幕构建器(无...截断):
bash
python3 scripts/buildkoreansrt.py \
--script \
--audio \
--output /podcast.srt \
--max-chars 22

步骤5) 渲染带字幕的MP4(字体+时间)

使用可调整字体和时间偏移的渲染器:
bash
python3 scripts/rendersubtitledvideo.py \
--image \
--audio \
--srt \
--output /final.mp4 \
--font-name Do Hyeon \
--font-size 27 \
--shift-ms -250

注意:

  • - shift-ms为负值=字幕提前(用于延迟修复)
  • 如果出现文本裁剪,降低font-size(例如25~27)
  • 保持文本在安全区域内;避免与角色/物体重叠

步骤6) 构建缩略图+YouTube元数据

bash

通过环境变量设置API密钥(必需)


export GEMINIAPIKEY=

python3 scripts/buildpodcastassets.py \
--source

参考(布局/文案护栏):

  • - references/thumbnailguidelinesko.md

步骤7) 最终交付清单

始终包含:

  1. 1. 使用的源
  2. 最终MP3路径
  3. 字幕MP4路径+大小
  4. 缩略图路径
  5. YouTube标题选项(3个)
  6. YouTube描述

可靠性规则

  • - Gemini长输入超时:使用分块构建器(builddualvoiceaudio.py)
  • 字幕裁剪:减小字体大小并增加底部边距
  • 字幕延迟:调整--shift-ms(通常为-150到-300)
  • 保持生成的资产在Telegram实际限制范围内

安全说明

  • - API密钥必须通过环境变量传递(GEMINIAPIKEY),不可硬编码。
  • 切勿将原始密钥粘贴到提示词、日志、截图或公开帖子中。
  • 近期加固:缩略图生成现在通过环境变量传递密钥(而非CLI参数)。

参考资料

  • - references/podcastprompttemplateko.md
  • references/workflowrunbook.md
  • references/thumbnailguidelinesko.md

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ai-podcast-pipeline-1776324425 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ai-podcast-pipeline-1776324425 技能

通过命令行安装

skillhub install ai-podcast-pipeline-1776324425

下载

⬇ 下载 ai-podcast-pipeline v0.1.5(免费)

文件大小: 20.09 KB | 发布时间: 2026-4-17 16:01

v0.1.5 最新 2026-4-17 16:01
Security: Added notice for VirusTotal false positives

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部