CIFAR-10是由Alex和Ilya整理的一个用于识别普适物体的小型数据集。
一共包括10格类别的RGB彩色图片:
飞机、汽车、鸟、猫、鹿、狗、蛙、马、船、卡车

图片尺寸为:32*32
数据集中:50 000张训练图、10 000张测试图
与MNIST相比,CIFAR-10具有以下不同点:
1.CIFAR-10是3通道的彩色RGB图像,而MNIST是灰度图
2.CIFAR-10的尺寸为:32*32,MNIST的尺寸为:28*28
3.CIFAR-10含有的是现实世界中真实的物体,噪声大,比例,特征都不相同
直接的线性模型如:Softmax在CIFAR-10上表现很差
数据集内容如下:

cifar-10-binary.tar.gz为原始压缩文件包,cifar-10-batches-bin为解压后的资源文件夹。
打开cifar-10-batches-bin文件夹:

介绍:
batches.meta.txt:为文本文件,储存了每个类别的英文名
data_batch_1.bin、
data_batch_2.bin、
data_batch_3.bin、
data_batch_4.bin、
data_batch_5.bin
是5个训练数据集,每个文件存储了10000张32*32彩色图片和对应的类别标签,共50 000张
test _batch.bin 存储了用于测试的10000张32*32彩色图片和对应的类别标签
readme.html是数据集介绍文件
网友评论