Python计算机视觉 |
您所在的位置:网站首页 › 手写字体怎么识别 › Python计算机视觉 |
文章目录
一、minist数据集的特点
二、思路
三、原理介绍
四、实现过程
1、代码:
五、分析总结
一、minist数据集的特点
minist数据集可以在 http://yann.lecun.com/exdb/mnist/ 获取,它包含以下四个部分: MNIST 数据集来自美国国家标准与技术研究所,National Institute of Standards and Technology(NIST)。 训练集 (training set) 由来自 250 个不同人手写的数字构成,其中 50% 是高中学生,50% 来自人口普查局 (the Census Bureau) 的工作人员. 测试集(test set)也是同样比例的手写数字数据。 如图为minist数据集的范本: 把图片当成一枚枚像素来看,下图为手写体数字1的图片,它在计算机中的存储其实是一个二维矩阵,每个元素都是0~1之间的数字,0代表白色,1代表黑色,小数代表某种程度的灰色。 卷积神经网络(Convolutional Neural Networks/CNNS/ConvNets)与普通神经网络非常相似,他们都由可学习的权重和偏置常量(biases)的神经元组成。每个神经元都接收一些输入,并做一些点积计算,输出是每个分类的分数,普通神经网络里的一些计算技巧到这里依旧适用。 卷积神经网络利用输入是图片的特点,把神经元设计成三个维度:width,height,depth(注意这个depth不是神经网络的深度,而是用来描述神经元的)。比如输入的图片大小是32323(rgb),那么输入神经元也就具有32323的维度。 一个卷积神经网络由很多层组成,它们的输入是三维的,输出也是三维的,有的层有参数,有的层不需要参数。 卷积神经网络通常包含以下几种层: 数据输入层: 该层要做的处理主要是对原始图像数据进行预处理,其中包括: • 去均值:把输入数据各个维度都中心化为0,如下图所示 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |