在学习机器学习的时候,首要的任务的就是准备一份通用的数据集,方便与其他的算法进行比较。
MNIST数据集是一个手写数字数据集,每一张图片都是0到9中的单个数字,比如下面几个:
MNIST数据库的来源是两个数据库的混合,一个来自Census Bureau employees(SD-3),一个来自high-school students(SD-1);有训练样本60000个,测试样本10000个。训练样本和测试样本中,employee和student写的都是各占一半。60000个训练样本一共大概250个人写的。训练样本和测试样本的来源人群没有交集。MNIST数据库也保留了手写数字与身份的对应关系。
TensorFlow使用MNIST 数据集
我们可以使用Tensorflow提供的 脚本来加载数据集: