(1) Youtube Face
http://www.cs.tau.ac.il/~wolf/ytfaces/,
http://www.msn.com/zh-cn?pc=EUPP_
用户名 wolftau 密码 wtal997
人数:1595
图像数:未知,共 3425 个视频(最长 6,070 帧,最短 48 帧)
Video
1
Subject
591
2
471
3
307
4
167
5
51
6
8
Frame_images_DB.tar.gz
从 Youtube 上下载的视频,剪切成帧
路径:subject_name\video_number\video_number.frame.jpg
对于每个人,对应一个 subject_name.labeled_faces.txt 文件,文件中的格式
为:
Filename,[ignore],x,y,width,height,[ignore],[ignore]
其中,x,y 是人脸图像的中心坐标,width 和 height 是图像的宽度和高度,例
如,
$head -3 Richard_Gere.labeled_faces.txt
Richard_Gere\3\3.618.jpg,0,262,165,132,132,0.0,1
aligned_images_DB.tar.gz
(5.4GB,md5sum: 915accad71cd59c8d14399686e0c91f9)
相比 Frame_images_DB.tar.gz 中的图像,做了以下预处理:
(a) 人脸检测,用 2.2 倍大小的 bounding box,将图像从原图中剪切出来
(b) 对齐
路径:subject_name\video_number\aligned_detect_video_number.frame.jpg
Descriptors_DB.tar.gz
(7.9GB, md5sum: cb25c4099f14c10e6c88a4bc1e6bb1a9)
图像帧的带有 descriptor 的 mat 文件
路径:subject_name\mat files
每个 video 对应两个文件:aligned_video_1.mat 和 video_1.mat
分别是对齐的和非对齐的版本,此外,一帧图像带有多个 descriptor(不同的
特征描述),例如,一个 80 帧的 video,
VID_DESCS_FPLBP:
[560x80 double]
VID_DESCS_LBP:
[1770x80 double]
VID_DESCS_CSLBP:
[480x80 double]
VID_DESCS_FILENAMES: {1x80 cell}
Meta_data.tar.gz
(132MB,md5sum)
包含 meta_和_split.mat 文件,用于访问 descriptor 数据。Split 将整个数据集
分成了 10 个独立的 split。
Split 中的每个三元组的格式为(index1, index2, is_same_person),其中 index1
和 index2 是 maxt_names 结构中的标记。总共 5000 对,等分成 10 个独立的
split,其中 2500 对相同,2500 对不同。
video_labels: [1x3425 double]
video_names: {3425x1 cell
mat_names: {3425x1 cell}
Splits:
[500x3x10 double]
Headpose_DB.tar.gz (5.8MB, md5sum: 05efac9e4ae1a9ed28c2ed09bdbdd137)
对于数据集中的每一帧人脸图像,带有 3 种不同旋转角度的头部姿态
路径:headorient_apirun_subject_name_video_number.mat
每个 mat 文件的结构为:headpose: [3x60 double]
Sources.tar.gz
(5.6MB, md5sum: a965855464902af63dd44f16471025ab)
用于 benchmark 测试及实现以上所有方法。详见 README 文件。
(2) LFW (Labeling Faces Wild)
http://vis-www.cs.umass.edu/lfw/#deepfunnel-anchor
人数:5749,图像数:13,000,from web
其中,1680 人有超过 2 张图片
包括 4 种图像:
lwf
deep funneling
funneling
lwf-a 用商业人脸对齐软件处理后的图像
超像素(super-pixels)包括:
lwf superpixels
lfw funneled superpixels
lfw deep funneld superpixels
其中,view1 文件夹,是推荐的用于 train/test 的独立的、随机产生的 split,可
用于 10-fold 交叉验证,以避免过拟合。
view1 中文件如下:
此外,view2 用于 benchmark 对比,view2 中文件如下:
(3) CelebFaces(A)
http://personal.ie.cuhk.edu.hk/~ys014/projects/Faceness/Faceness.html
在 DeepID2 中 , 将 CelebFaces 分 成 CelebFaces+A(8192 个 人 ) 和
CelebFaces+B(1985 个 人 ) 。 因 此 CelebFaces(A) 中 应 有 8192 个 人 。
CelebFaces 是私有的样本库,共 202,599 幅图像。
另外,Large-scale CelebFaces Attributes (CelebA) Dataset 文件夹包含
(4) MegaFace
http://megaface.cs.washington.edu/dataset/download.html
Username:dutongchun@126.com
Password: svyA~oAf.e
(5) CASIA WebFace
http://www.cbsr.ia.ac.cn/english/CASIA-WebFace-Database.html
人数:10575,图像数:494,414。公有。
目前,需要打印协议,签字、发送给作者,才能得到下载需要的用户名和密
码。
人脸识别数据集说明及其下载
提供了对人脸识别数据集(1)Youtube Face(2)LFW (Labeling Faces Wild)(3)
CelebFaces(A)(4)MegaFace(5)CASIA WebFace 的说明,及提供了下载方式