深度学习常用标签工具和数据集

标签工具

  • labelimg:目标进行大致的标定,适用于图像检测任务的数据集制作
  • labelme:用于较为细致的轮廓标定,适用于图像分割任务的数据集制作
  • VoTT:微软出品,既可以标注视频,也可以标注图片,而且支持已有模型的集成,适用于图像检测任务的数据集制作
  • yolo_mark:yolo2的团队开源的一个图像标注工具,适用于图像检测任务的数据集制作
  • Vatic:可以做视频的标注,适用于图像检测任务的数据集制作
  • Sloth:适用于图像检测任务的数据集制作
  • Annotorious:提供了相应的API接口,方便直接修改和调用,适用于图像检测任务的数据集制作
  • RectLabel:Mac平台,适用于图像检测任务的数据集制作
  • IAT:支持一些基础形状的选择,适用于图像分割任务的数据集制作

数据集

目标检测

  • mnist:手写字体识别是深度学习入门级数据样本集,总共有70000张28*28的手写字体黑白图片
  • PASCAL VOC:2GB、人类、动物、交通工具等20个类别,适合用来测试算法性能
  • COCO:40GB、对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述。适合图像识别、分割和图像语义
  • Imagenet:1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注,于图像分类、定位、检测等研究工作大多基于此数据集展开

人脸检测

  • UMDFaces:8000+个类别,总共36W张人脸图片,全都是经过标注的样本,标注信息保存在csv文件中,除了人脸的box,还有人脸特征点的方位信息

人脸识别

  • FDDB:2010年非约束环境人脸检测数据库FDDB,总共2845张图像,5171张,人脸非约束环境,人脸的难度较大,有面部表情,双下巴,光照变化,穿戴,夸张发型,遮挡等难点,是目标最常用的数据库
  • WIDER FACE:2016年提出的,目前难度最大的WIDER FACE,共32203图像,393703标注人脸,目前难度最大,各种难点比较全面:尺度,姿态,遮挡,表情,化妆,光照等
  • CASIA-WebFace:李子青组的 CASIA-WebFace(50万,1万个人). 需申请
  • MegaFace:华盛顿大学百万人脸MegaFace数据集. 邮件申请, 是一个60G的压缩文件. MegaFace
  • WLFDB:南洋理工 WLFDB. (70万+,6,025). 需申请
  • MSRA-CFW:微软的MSRA-CFW ( 202792 张, 1583人). 可以直接通过OneDrive下载
  • CelebA:汤晓欧实验室的CelebA(20万+), 标注信息丰富. 现在可以直接从百度网盘下载
  • FaceScrub:提供图片下载链接(100,100张,530人)