安防摄像头视频 VL 模型微调数据集标注工具。用于从安防摄像头视频中提取关键帧、分析视频内容、生成结构化标注(含环境/人物/行为/风险描述),并输出符合 dataset.jsonl 格式的微调训练数据。Use when 用户需要对安防摄像头视频进行数据标注、生成 VL 模型训练数据集、处理 /root/hair-cam 目录下的视频数据,或提及 "hair-cam"、"数据标注"、"视频标注"、"VL模型微调"。
对安防摄像头拍摄的视频进行帧提取、视觉分析、结构化标注,输出 dataset.jsonl 格式的 VL 模型微调数据集。
bash
python3
--data-dir <视频目录> \
--output-dir <帧输出目录> \
--fps 0.5 \
--max-frames 4
对每个视频:
标注 JSON 结构:
json
{
title: 场景标题,
subtitle: 场景副标题,
description: 详细描述(≥50字,含环境、人物外貌、行为姿态),
labels: [systemsuggestX, ...],
risk: {
level: none|low|medium|high,
description: 风险描述
},
simple_description: 简练描述(≤20汉字)
}
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 sjht-cam-anno-1776214083 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 sjht-cam-anno-1776214083 技能
skillhub install sjht-cam-anno-1776214083
文件大小: 9.66 KB | 发布时间: 2026-4-17 16:07