Loom Workflow Analyzer
Transforms Loom recordings into structured, automatable workflows.
Quick Start
CODEBLOCK0
Pipeline
- 1. Download - Fetches Loom video via yt-dlp
- Smart Extract - Captures frames at scene changes + transcript timing
- Transcribe - Whisper transcription with word-level timestamps
- Analyze - Multimodal AI analysis (requires vision model)
- Generate - Creates Lobster workflow with approval gates
Smart Frame Extraction
Frames are captured when:
- - Scene changes - Significant visual change (ffmpeg scene detection)
- Speech starts - New narration segment begins
- Combined - Speech + visual change = high-value moment
- Gap fill - Max 10s without a frame
Analysis Output
The analyzer produces:
- -
workflow-analysis.json - Structured workflow definition - INLINECODE1 - Human-readable summary
- INLINECODE2 - Executable Lobster workflow file
Ambiguity Detection
The analyzer flags:
- - Unclear mouse movements
- Implicit knowledge ("the usual process")
- Decision points ("depending on...")
- Missing credentials/context
- Tool dependencies
Vision Analysis Step
After extraction, use the generated prompt with a vision model:
CODEBLOCK1
Save the JSON response to workflow-analysis.json, then:
CODEBLOCK2
Lobster Integration
Generated workflows use:
- -
approve gates for destructive/external actions - INLINECODE5 for classification/decision steps
- Resume tokens for interrupted workflows
- JSON piping between steps
Requirements
- -
yt-dlp - Video download - INLINECODE7 - Frame extraction + scene detection
- INLINECODE8 - Audio transcription
- Vision-capable LLM for analysis step
Multilingual Support
Works with any language - Whisper auto-detects and transcribes.
Analysis should be prompted in the video's language for best results.
Loom 工作流分析器
将 Loom 录制内容转换为结构化的、可自动化的工作流。
快速开始
bash
完整流程 - 下载、提取、转录、分析
{baseDir}/scripts/loom-workflow analyze https://loom.com/share/abc123
单步操作
{baseDir}/scripts/loom-workflow download https://loom.com/share/abc123
{baseDir}/scripts/loom-workflow extract ./video.mp4
{baseDir}/scripts/loom-workflow generate ./analysis.json
流程
- 1. 下载 - 通过 yt-dlp 获取 Loom 视频
- 智能提取 - 在场景切换和转录时间点捕获帧
- 转录 - 使用 Whisper 进行带词级时间戳的转录
- 分析 - 多模态 AI 分析(需要视觉模型)
- 生成 - 创建带审批关卡的工作流
智能帧提取
在以下情况捕获帧:
- - 场景切换 - 显著的视觉变化(ffmpeg 场景检测)
- 语音开始 - 新的叙述段落开始
- 组合触发 - 语音 + 视觉变化 = 高价值时刻
- 间隙填充 - 最长 10 秒无帧
分析输出
分析器生成:
- - workflow-analysis.json - 结构化工作流定义
- workflow-summary.md - 人类可读的摘要
- *.lobster - 可执行的 Lobster 工作流文件
歧义检测
分析器标记:
- - 不明确的鼠标移动
- 隐含知识(常规流程)
- 决策点(取决于...)
- 缺失的凭据/上下文
- 工具依赖
视觉分析步骤
提取后,使用生成的提示词配合视觉模型:
bash
提示词位于:output/workflow-analysis-prompt.md
附加帧位于:output/frames/
以 Claude 为例:
cat output/workflow-analysis-prompt.md | claude --images output/frames/*.jpg
将 JSON 响应保存到 workflow-analysis.json,然后:
bash
{baseDir}/scripts/loom-workflow generate ./output/workflow-analysis.json
Lobster 集成
生成的工作流使用:
- - approve 关卡用于破坏性/外部操作
- llm-task 用于分类/决策步骤
- 中断工作流的恢复令牌
- 步骤间的 JSON 管道传输
系统要求
- - yt-dlp - 视频下载
- ffmpeg - 帧提取 + 场景检测
- whisper - 音频转录
- 支持视觉的 LLM 用于分析步骤
多语言支持
支持任何语言 - Whisper 自动检测并转录。
分析时应使用视频语言进行提示以获得最佳效果。