返回顶部
g

gemini-video-analyzer双子视频分析器

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
369
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

gemini-video-analyzer

Gemini 视频分析器

使用 Google Gemini 的多模态 API 原生分析视频。无需提取帧——Gemini 以 1 FPS 处理视频,具备完整的运动、音频和视觉理解能力。

快速开始

bash

使用默认提示词分析视频(完整描述)


GOOGLEAIAPIKEY=$GOOGLEAIAPIKEY python3 {baseDir}/scripts/analyze.py /path/to/video.mp4

提出具体问题

GOOGLEAIAPIKEY=$GOOGLEAIAPIKEY python3 {baseDir}/scripts/analyze.py /path/to/video.mp4 屏幕上显示什么文字?

管理已上传文件

GOOGLEAIAPIKEY=$GOOGLEAIAPIKEY python3 {baseDir}/scripts/manage_files.py list GOOGLEAIAPIKEY=$GOOGLEAIAPIKEY python3 {baseDir}/scripts/manage_files.py cleanup

支持的格式

MP4、AVI、MOV、MKV、WebM、FLV、MPEG、MPG、WMV、3GP——每个文件最大 2GB。

工作原理

  1. 1. 视频上传至 Google 的 Files API(临时存储,48 小时后自动删除)
  2. Gemini 以每秒 1 帧的速度处理——理解运动、转场、音频上下文
  3. 模型根据您的提示词生成响应
  4. 在理解时序内容方面远优于帧提取方法

使用场景

任务示例提示词
通用描述(默认——无需提示词)
UI/文字提取
屏幕上显示哪些文字和 UI 元素? | | 教程总结 | 总结本教程中展示的步骤 | | 视频错误报告 | 描述此屏幕录制中出现的错误 | | 会议记录 | 总结讨论的关键要点 | | 内容对比 | 上传 2 个视频,询问差异 |

配置

在环境变量或 .env 文件中设置 GOOGLEAIAPIKEY。在 aistudio.google.com 获取免费密钥。

默认模型:gemini-2.5-flash(快速、廉价、出色的视觉能力)。对于复杂分析,可使用 --model gemini-2.5-pro 覆盖。

API 参考

关于文件上传限制、处理详情和高级选项,请参阅 references/gemini-files-api.md

致谢

M. Abidi 构建 · LinkedIn · YouTube · GitHub · 预约通话

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 gemini-video-analyzer-1776420045 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 gemini-video-analyzer-1776420045 技能

通过命令行安装

skillhub install gemini-video-analyzer-1776420045

下载

⬇ 下载 gemini-video-analyzer v1.0.0(免费)

文件大小: 5.85 KB | 发布时间: 2026-4-17 18:50

v1.0.0 最新 2026-4-17 18:50
Initial release of gemini-video-analyzer.

- Native video analysis using Google Gemini API with support for full scene description, text/UI extraction, object/action identification, and question answering.
- Supports multiple video formats (MP4, AVI, MOV, etc.) up to 2GB per file.
- Processes videos at 1 FPS with motion, audio, and visual understanding—no manual frame extraction needed.
- Includes command-line scripts for analysis, file management, and prompt-based queries.
- Requires a Google AI API key; configurable via environment variable.
- Suitable for summarizing, extracting information, comparing videos, and analyzing tutorials or walkthroughs.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部