Traffic Crash Analysis

交通事故视频理解领域的模型、数据集与工具整合。

核心项目

1. CrashChat

论文: CrashChat: A Multimodal Large Language Model for Multitask Traffic Crash Video Analysis (2025)

GitHub: https://github.com/Liangkd/CrashChat

HuggingFace:

- 模型: https://huggingface.co/KDliang/crashchat
数据集: https://huggingface.co/datasets/KDliang/CrashChat

核心特性:

- 基于 VideoLLaMA-3 7B 的多模态大语言模型
支持 6 大任务:

1. Crash recognition（事故识别）
2. Crash description（事故描述）
3. Causal reasoning（因果推理）
4. Prevention reasoning（预防推理）
5. Pre-crash localization（事故前定位）
6. Crash localization（事故定位）

- 数据规模: 18,385 视频，96,184 video-QA 对
训练策略: 独立单任务 / 同质多任务 / 异质多任务

任务分类:

- Linguistic-centric: crash recognition, crash description, causal reasoning, prevention reasoning
Perception-centric: pre-crash localization, crash localization

2. Traffix VideoQA (TUMTraf)

论文: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes

主页: https://traffix-videoqa.github.io/

核心特性:

- 交通场景时空视频理解基准
数据规模: 1,000 视频，85,000 多选 QA 对
支持 3 大任务:

1. Multiple-choice video QA
2. Referred object captioning（2,300 标注）
3. Spatio-temporal object grounding（5,700 标注）

- 特色: tuple-based 时空对象表达，恶劣天气场景
基线模型: TraffiX-Qwen（视觉 token 采样策略）

模型对比

特性	CrashChat	Traffix VideoQA
骨干模型	VideoLLaMA-3 7B	TraffiX-Qwen
数据规模

18,385 视频 | 1,000 视频 |
| 任务数 | 6 | 3 |
| 特色 | 多任务学习、因果推理 | 时空定位、恶劣天气 |
| 开源程度 | 权重+数据+代码 | 数据集+基准 |

使用场景

CrashChat 适用场景

- 事故原因分析（为什么会发生碰撞？）
预防措施建议（如何避免类似事故？）
事故时间定位（碰撞发生在第几秒？）
事故描述生成（详细描述事故过程）

Traffix VideoQA 适用场景

- 交通监控视频问答
特定对象定位（找到红色轿车）
时空关系理解（两车何时相遇？）
恶劣条件下的场景理解

快速开始

CrashChat 安装

CODEBLOCK0

模型权重下载

从 HuggingFace 下载预训练权重:

# 基线模型
huggingface-cli download KDliang/crashchat --local-dir ./ckpt

# 或按任务下载
# ckpt/videollama3_baseline
# ckpt/heterogeneous_multitask (推荐：全任务版本)

训练与评估

训练命令

CODEBLOCK2

评估流程

CODEBLOCK3

资源导航

数据集

- CrashChat Dataset: https://huggingface.co/datasets/KDliang/CrashChat
TUMTraf VideoQA: https://traffix-videoqa.github.io/

论文

- CrashChat: https://arxiv.org/abs/2512.18878
Traffix VideoQA: 见项目主页

模型权重

- CrashChat-7B: https://huggingface.co/KDliang/crashchat/tree/main/ckpt
VideoLLaMA-3 原版: https://huggingface.co/KDliang/crashchat/tree/main/videollama3originalmodel

References

详细文档见 references/ 目录:

- models.md - 模型架构与训练策略详解
INLINECODE2 - 数据集格式与标注说明
INLINECODE3 - 六大任务定义与评估方法

交通事故分析

交通事故视频理解领域的模型、数据集与工具整合。

核心项目

1. CrashChat

论文: CrashChat: 面向多任务交通事故视频分析的多模态大语言模型 (2025)

GitHub: https://github.com/Liangkd/CrashChat

HuggingFace:

- 模型: https://huggingface.co/KDliang/crashchat
数据集: https://huggingface.co/datasets/KDliang/CrashChat

核心特性:

- 基于 VideoLLaMA-3 7B 的多模态大语言模型
支持 6 大任务:

1. 事故识别
2. 事故描述
3. 因果推理
4. 预防推理
5. 事故前定位
6. 事故定位

- 数据规模: 18,385 个视频，96,184 个视频问答对
训练策略: 独立单任务 / 同质多任务 / 异质多任务

任务分类:

- 语言中心型: 事故识别、事故描述、因果推理、预防推理
感知中心型: 事故前定位、事故定位

2. Traffix VideoQA (TUMTraf)

论文: 交通场景统一时空视频理解基准

主页: https://traffix-videoqa.github.io/

核心特性:

- 交通场景时空视频理解基准
数据规模: 1,000 个视频，85,000 个多选问答对
支持 3 大任务:

1. 多项选择视频问答
2. 指代对象描述（2,300 个标注）
3. 时空对象定位（5,700 个标注）

- 特色: 基于元组的时空对象表达，恶劣天气场景
基线模型: TraffiX-Qwen（视觉令牌采样策略）

模型对比

特性	CrashChat	Traffix VideoQA
骨干模型	VideoLLaMA-3 7B	TraffiX-Qwen
数据规模

18,385 个视频 | 1,000 个视频 |
| 任务数 | 6 | 3 |
| 特色 | 多任务学习、因果推理 | 时空定位、恶劣天气 |
| 开源程度 | 权重+数据+代码 | 数据集+基准 |

使用场景

CrashChat 适用场景

- 事故原因分析（为什么会发生碰撞？）
预防措施建议（如何避免类似事故？）
事故时间定位（碰撞发生在第几秒？）
事故描述生成（详细描述事故过程）

Traffix VideoQA 适用场景

- 交通监控视频问答
特定对象定位（找到红色轿车）
时空关系理解（两车何时相遇？）
恶劣条件下的场景理解

快速开始

CrashChat 安装

bash

克隆仓库

git clone https://github.com/Liangkd/CrashChat.git
cd CrashChat

创建环境

conda create -n crashchat python=3.10 -y conda activate crashchat

安装依赖

pip install torch==2.4.0 torchvision==0.19.0 --extra-index-url https://download.pytorch.org/whl/cu118 pip install -r requirements.txt pip install flashattn-2.7.3+cu11torch2.4cxx11abiFALSE-cp310-cp310-linuxx86_64.whl --no-deps conda install -c conda-forge ffmpeg -y

模型权重下载

从 HuggingFace 下载预训练权重:
bash

基线模型

huggingface-cli download KDliang/crashchat --local-dir ./ckpt

或按任务下载

ckpt/videollama3_baseline

ckpt/heterogeneous_multitask（推荐：全任务版本）

训练与评估

训练命令

bash

单 GPU

CUDAVISIBLEDEVICES=0 bash scripts/train/Independentmonotaskmodelscausalreasoning.sh 1

多 GPU

CUDAVISIBLEDEVICES=1,2 bash scripts/train/Independentmonotaskmodelscausalreasoning.sh 2

评估流程

bash

1. 转换权重

python tool/mergeandconvertvideollama3lora.py

2. 运行评估

CUDAVISIBLEDEVICES=0 bash scripts/eval/evalvideocausal_reasoning.sh

3. 计算指标

python scripts/eval/computecausalreasoning_metrics.py

资源导航

数据集

- CrashChat 数据集: https://huggingface.co/datasets/KDliang/CrashChat
TUMTraf VideoQA: https://traffix-videoqa.github.io/

论文

- CrashChat: https://arxiv.org/abs/2512.18878
Traffix VideoQA: 见项目主页

模型权重

- CrashChat-7B: https://huggingface.co/KDliang/crashchat/tree/main/ckpt
VideoLLaMA-3 原版: https://huggingface.co/KDliang/crashchat/tree/main/videollama3originalmodel

参考文献

详细文档见 references/ 目录:

- models.md - 模型架构与训练策略详解
datasets.md - 数据集格式与标注说明
tasks.md - 六大任务定义与评估方法

traffic-crash-specialist交通事故分析

traffic-crash-specialist

Traffic Crash Analysis

核心项目

1. CrashChat

2. Traffix VideoQA (TUMTraf)

模型对比

使用场景

CrashChat 适用场景

Traffix VideoQA 适用场景

快速开始

CrashChat 安装

模型权重下载

训练与评估

训练命令

评估流程

资源导航

数据集

论文

模型权重

References

交通事故分析

核心项目

1. CrashChat

2. Traffix VideoQA (TUMTraf)

模型对比

使用场景

CrashChat 适用场景

Traffix VideoQA 适用场景

快速开始

CrashChat 安装

克隆仓库

创建环境

安装依赖

模型权重下载

基线模型

或按任务下载

ckpt/videollama3_baseline

ckpt/heterogeneous_multitask（推荐：全任务版本）

训练与评估

训练命令

单 GPU

多 GPU

评估流程

1. 转换权重

2. 运行评估

3. 计算指标

资源导航

数据集

论文

模型权重

参考文献

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement