一、market1501
1) “bounding_box_test”——用于测试集的 750 人,包含 19,732 张图像,前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图(可能与query是同一个人),-1 表示检测出来其他人的图(不在这 750 人中)
2) “bounding_box_train”——用于训练集的 751 人,包含 12,936 张图像
3) “query”——为 750 人在每个摄像头中随机选择一张图像作为query,因此一个人的query最多有 6 个,共有 3,368 张图像
4) “gt_query”——matlab格式,用于判断一个query的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)
5) “gt_bbox”——手工标注的bounding box,用于判断DPM检测的bounding box是不是一个好的box
1、以 0001_c1s1_000151_01.jpg 为例
1) 0001 表示每个人的标签编号,从0001到1501;
2) c1 表示第一个摄像头(camera1),共有6个摄像头;
3) s1 表示第一个录像片段(sequece1),每个摄像机都有数个录像段;
4) 000151 表示 c1s1 的第000151帧图片,视频帧率25fps;
5) 01 表示 c1s1_001051 这一帧上的第1个检测框,由于采用DPM检测器,对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框
bounding_box_test 文件夹是 gallery 样本,bounding_box_train 文件夹是 train 样本,query 文件夹是 query 样本
二、CUHK03
(1) 采集于香港中文大学(CUHK)校园。数据以”cuhk-03.mat”的 MAT 文件格式存储,含有 1467 个不同的人物,由 5 对摄像头采集。
(2)目录介绍
(1)”detected”—— 5 x 1 cells,由机器标注,每个 cell 中包含一对摄像头组采集的照片,如下所示:
每个摄像头组由 M x 10 cells 组成,M 为行人索引,前 5 列和后 5 列分别来自同一组的不同摄像头。
cell 内每个元素为一幅 H x W x 3 的行人框图像(uint8 数据类型),个别图像可能空缺,为空集。
(2)”labeled”—— 5 x 1 cells,行人框由人工标注,格式和内容和”detected”相同。
(3)”testsets”—— 20 x 1 cells,测试协议,由 20 个 100 x 2 double 类型矩阵组成 (重复二十次)。
100 x 2 double,100 行代表 100 个测试样本,第 1 列为摄像头 pair 索引,第 2 列为行人索引。
(3)测试协议
CUHK-03的测试协议有两种。第一种为旧的版本(参考文献 [1], 即数据集的出处),参见数据集中的’testsets’测试协议。具体地说,即随机选出100个行人作为测试集,1160 个行人作为训练集,100 个行人作为验证集(这里总共 1360 个行人而不是 1467 个,这是因为实验中没有用到摄像头组pair 4 和 5 的数据),重复二十次。这种测试协议是 single-shot setting.
第二种测试协议(参考文献 [2])类似于 Market-1501 ,它将数据集分为包含 767 个行人的训练集和包含 700 个行人的测试集。在测试阶段,我们随机选择一张图像作为 query,剩下的作为 gallery,这样的话,对于每个行人,有多个 ground truth 在 gallery 中。(参考https://github.com/zhunzhong07/person-re-ranking)
留言与评论(共有 0 条评论) |