Market-1501
数据集信息
- 拍摄时间:2015年夏天
- 拍摄地点:清华大学校园
- 摄像头数量:6【5个1280x1080 HD摄像头+1个720x576 SD摄像头】
- 行人数量:1501个ID
- 训练集:751个ID【12,936张图片】
- 测试集:750个ID【19,732张图片】
- Query图像:3368张
- 标注方式:DPM(Deformable Part Model)
数据集特色
- 每个ID至少被2个摄像头拍到、至多被6个摄像头拍到。
- 基于DPM与手工标注得到行人检测框的重合度,评价bbox的质量
- 50%:good
- 20%,或者false alarm:distractor
- 其他:junk - 每个ID可能有多个query和ground truth
- Distractor Dataset
- 超过500,000个bbox
- 包括false alarms、不在1501个ID中的人
数据集结构
Market-1501
├── bounding_box_test
├── 0000_c1s1_000151_01.jpg
├── 0000_c1s1_000376_03.jpg
├── 0000_c1s1_001051_02.jpg
├── ······
├── bounding_box_train
├── 0002_c1s1_000451_03.jpg
├── 0002_c1s1_000551_01.jpg
├── 0002_c1s1_000801_01.jpg
├── ······
├── gt_bbox
├── 0001_c1s1_001051_00.jpg
├── 0001_c1s1_009376_00.jpg
├── 0001_c2s1_001976_00.jpg
├── ······
├── gt_query
├── 0001_c1s1_001051_00_good.mat
├── 0001_c1s1_001051_00_junk.mat
├── ······
├── query
├── 0001_c1s1_001051_00.jpg
├── 0001_c2s1_000301_00.jpg
├── 0001_c3s1_000551_00.jpg
├── ······
└── readme.txt
目录介绍
1) “bounding_box_test”——用于测试集的 750 人,包含 19,732 张图像,前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图(可能与query是同一个人),前缀为-1 代表“junk”
2) “bounding_box_train”——用于训练集的 751 人,包含 12,936 张图像
3) “query”——为 750 人在每个摄像头中随机选择一张图像作为query,因此一个人的query最多有 6 个,共有 3,368 张图像
4) “gt_query”——matlab格式,用于判断一个query的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)
5) “gt_bbox”——手工标注的bounding box,用于判断DPM检测的bounding box是不是一个好的box
命名规则
以 0001_c1s1_000151_00.jpg 为例
1) 0001 表示每个人的标签编号,从0001到1501;
2) c1 表示1#摄像头(共有6个摄像头);
3) s1 表示第一个录像片段(sequece1),每个摄像机都有数个录像段;
4) 000151 表示 c1s1 的第000151帧图片,视频帧率25fps;
5) 由于采用DPM检测器,对于每一帧上的行人可能会框出好几个bbox。00 表示 c1s1_001051 这一帧上的第1个检测框,
对应论文
If you use this dataset, please kindly cite this paper:
@inproceedings{zheng2015scalable, title={Scalable Person
Re-identification: A Benchmark}, author={Zheng, Liang and Shen,
Liyue and Tian, Lu and Wang, Shengjin and Wang, Jingdong and Tian,
Qi}, booktitle={Computer Vision, IEEE International Conference on},
year={2015} }
来源:CSDN
作者:X-funbean
链接:https://blog.csdn.net/qq_29159273/article/details/104385059