深度学习常用标签工具和数据集

标签工具

mnist：手写字体识别是深度学习入门级数据样本集，总共有70000张28*28的手写字体黑白图片
PASCAL VOC：2GB、人类、动物、交通工具等20个类别，适合用来测试算法性能
COCO：40GB、对于图像的标注信息不仅有类别、位置信息，还有对图像的语义文本描述。适合图像识别、分割和图像语义
Imagenet：1400多万幅图片，涵盖2万多个类别；其中有超过百万的图片有明确的类别标注和图像中物体位置的标注，于图像分类、定位、检测等研究工作大多基于此数据集展开

FDDB：2010年非约束环境人脸检测数据库FDDB,总共2845张图像，5171张，人脸非约束环境，人脸的难度较大，有面部表情，双下巴，光照变化，穿戴，夸张发型，遮挡等难点，是目标最常用的数据库
WIDER FACE：2016年提出的，目前难度最大的WIDER FACE，共32203图像，393703标注人脸，目前难度最大，各种难点比较全面：尺度，姿态，遮挡，表情，化妆，光照等
CASIA-WebFace：李子青组的 CASIA-WebFace(50万，1万个人). 需申请
MegaFace：华盛顿大学百万人脸MegaFace数据集. 邮件申请, 是一个60G的压缩文件. MegaFace
WLFDB：南洋理工 WLFDB. (70万+,6,025). 需申请
MSRA-CFW：微软的MSRA-CFW ( 202792 张, 1583人). 可以直接通过OneDrive下载
CelebA：汤晓欧实验室的CelebA(20万+), 标注信息丰富. 现在可以直接从百度网盘下载
FaceScrub：提供图片下载链接（100,100张，530人）