Kinetics-400迷你数据集

English | 简体中文

该数据集旨在解决的问题：参照Kinetics-400数据格式，训练基于自己数据的视频理解模型。

数据集介绍

Kinetics-400是视频领域benchmark常用数据集，详细介绍可以参考其官方网站Kinetics。整个数据集包含400个类别，全部文件大概需要135G左右的存储空间，下载起来比较困难。

Tiny-Kinetics-400同样包含400个类别，每个类别下仅有两条视频数据，分为train与val，可用于调试一些视频理解模型。

具体对比如下：

数据集	训练条数	验证条数	大小
Kinetics-400	234619	19761	135G
Tiny-Kinetics-400	400	400	420M

Tiny-Kinetics-400下载

目前提供了百度网盘的下载方式：

下载方式	链接
百度云	BaiduCloud
Google	GoogleDrive

抽帧Extract Frames

通常在训练视频理解模型时，会提前对视频文件进行抽帧，以此来加速训练过程。这里提供了抽帧脚本，且满足以下条件：

每个视频只抽取300帧
如果整个视频多于300帧，直接舍弃之后的视频帧
如果整个视频少于300帧，复制最后的视频帧以填充至300帧

使用方式：

python ./tools/extract_frames.py --source_dir ~/data/tiny-kinetics-400 ~/data/kinetics400_30fps_frames

将meta文件移到视频帧目录下：

mv ./annotations/tiny_train.csv ~/data/kinetics400_30fps_frames/
mv ./annotations/tiny_val.csv ~/data/kinetics400_30fps_frames/

最终的目录结构如下：

kinetics400_30fps_frames/
├── abseiling/
│   ├──_4YTwq0-73Y_000044_000054
│   │  ├──frame_00001.jpg
│   │  ├──...
│   ├──...
├──...
├── tiny_train.csv
├── tiny_val.csv

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
annotations		annotations
data		data
tools		tools
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Kinetics-400迷你数据集

数据集介绍

Tiny-Kinetics-400下载

抽帧Extract Frames

参考

About

Releases

Packages

Languages

Tramac/tiny-kinetics-400

Folders and files

Latest commit

History

Repository files navigation

Kinetics-400迷你数据集

数据集介绍

Tiny-Kinetics-400下载

抽帧Extract Frames

参考

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages