视频行为理解
from:https://x-algo.cn/index.php/2019/08/31/3220/ 行为识别是用来识别“人自身”、“人和人”、“人和物”的“行为”。比如“抽烟”,“打架”。这个任务有好几个数据集,接下来先介绍一下各个数据集。 数据集 HMDB-51(2011) 其中包含51 action,7k clips; 这个数据集合包含不同种类的视频( camera motion, viewpoint, video quality and occlusion) 和以往的数据集比较,这个视频数据更加真实,并且会有遮挡机位变化等。 当前数据集通过 静态的人体关节 变化不能识别对应的行为 51个action中,每一个至少包含101个clip 下图为和其他数据集的对比: 和其他数据集合的对比 数据样例: 点击我 ; 包含的行为种类有: 面部表情:微笑,大笑,咀嚼,交谈 面部和物体行为:吸烟,吃,喝 身体动作:车轮翻,鼓掌,爬 身体和物体之间行为:梳头发,抓东西,击剑 51个种类的分组 论文:H. Kuehne, et al. HMDB: A large video database for human motion recognition. In ICCV, pages 2556-2563, 2011. UCF-101(2012) 101类别,13k样本,27小时时长