离线手写数字的识别文献综述-文献综述网

毕业论文课题相关文献综述

{title}

毕业论文课题相关文献综述

{title}

2000字左右的文献综述：

文献综述

1.课题背景

图像的识别与分类属于当代计算机科学研究的重要领域，已发展成为一门独立的学科，在近些年里发展十分迅速。应用范围相当广泛，几乎遍及各个领域。在人工智能、系统控制、遥感数据分析、军事目标识别等领域，在国民经济、社会治安和社会发展等方面得到广泛的应用，对整个社会都产生了很深的影响。图像识别的目的在于用计算机自动处理某些信息系统，以代替人去完成图像分类以及辨别的任务。本毕业设计主要研究手写数字的识别，手写数字识别一直是多年来的研究热点，也是图像处理和模式识别领域中的研究课题之一。它的现实意义在于:随着金融市场化进程的日益加快，票据业务不断发展，票据数量与日俱增。手写数字识别在这个领域应用非常广泛，例如个人凭证、支票、发票、进账单等需要处理大量字符录入的票据，在很大程度上要依赖数据信息的输入。长期以来，票据管理工作因管理手段落后，各类票据的打印、整理、装订和归要花费大量的人力和物力，同时各类票据凭证的事后监督与归档的分类也浪费时间了大量的人力物力。如果能通过手写数字识别技术实现信息的自动录入，无疑大大有利于解决传统的人工处理方式中存在的工作量大、成本高、效率低等问题。

2.研究现状

(1).此类技术的发展

目前字符识别研究中使用最广泛的方法是光学字符识别（OCR），而手写数字识别是OCR 的一个研究方向，它研究的对象是怎样利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。由于这个问题的特殊性，传统的OCR 方法不能有效地解决这些问题。因此，手写数字的识别方法应该是一种具有自适应、抗干扰、能够有效地解决手写数字分割、统计模式识别与结构模式识别相结合的方法。过去的数十年中，研究者们曾使用基于结构特征的方法 ^[1]、基于统计特征的方法 ^[1] 、基于神经网络的方法 ^[2-3] 解决手写数字识别问题，取得了很多令人满意的成果。结构特征^[4-5]通常包括园、端点、交叉点、笔划、轮廓等，能描述字符的结构，在识别过程中有效地结合几何的知识，得到可靠性较高的识别结果；统计特征^[6] 通常包括点密度的测量、矩、特征区域等，易于训练，而在给定的训练集上能够得到相对较高的识别率。基于神经网络的方法是采用人类大脑神经中学习反馈的思想，通过用户训练得出正确的识别结果。这是当今应用的最广泛的方法，特点在于样本数可以比较少，因此有比较好的运行效率，实现较简单。但是识别的过程需要人的参与，识别的正确率受用户主观因素的影响。误差反向传播神经网络，简称BP 网络 ^[7] ，是朝着满足给定的输入输出关系方向进行自组织的神经网络，目前已经成为广泛使用的网络，并在此基础做了很多改进，发展了很多快速收敛学习算法。支持向量机，简称SVM ^[8]，是统计学习方法，应用于寻找图像像素之间的特征差别，有很高的分类准确率，成为现在研究的热点。

(2). 主要从事这方面研究的公司

南京帅安科技责任有限公司：是专业致力于自动录入与识别技术的高科技公司。拥有HCR（手写字符识别）、OMR（光学符号识别）、OGR（光学图像图表识别）等先进的自动识别技术。

烟台永信视觉技术有限公司：永信视觉是一家以人工智能、机器视觉、图像识别为研究方向，专业从事检测、识别、跟踪、自动化等相关解决方案开发的公司。具备从底层核心分析算法的研发、到嵌入式软硬件产品的设计开发、至大型监控平台系统的设计开发的完整解决方案提供能力。

(3). 高校和学者及他们的成果

山东大学硕士宫淑兰对手写数字识别的原理、方法进行了深入的研究，提出的识别技术精度较高，可以达到实际应用的要求。其论文成果对于信息的自动化、国民经济信息网络的推广具有重要意义，对于手写汉字识别的研究具有很高的参考价值^[9]。

广州大学的胡莹在字符识别研究中，使用统计识别方法和神经网络相结合的方法,建立分类器，大大节省了字符识别的时间。还加入了学习的功能,以便以后识别能力的扩展。在结构分析中，采用树转换的方法来分析数学公式的结构,实验表明,这种策略具有较好的适用性^[10]。

北京邮电大学的董慧研究了多种手写数字特征的基础上，论文中提取了轮廓特征、笔划密度特征、粗网格特征、重心及重心矩特征、首个黑点位置特征、投影特征及傅立叶变换特征等七种手写数字的结构和统计特征^[11]。

华中师范大学宋婉娟提出了一种基于识别的分割方法以得到分割最佳组合，这种分割方法的分割结果是基于识别结果的，在识别数字的同时得到分割结果；设计了包含sigmoid神经元的BP神经网络分类器识别手写数字，在训练分类器的时候，将反例样本作为必要的训练样本估计分类器的参数，并且合理的选择正例样本和反例样本的比例,这样训练得到的分类器具备很好的分类能力^[12]。

南京理工大学的瞿海金在论文中分别分析了十个阿拉伯数字的不同特征,针对不同的特征设计了不同的识别方法。对于每一个识别问题进行十个二分类的识别,然后再进行综合识别,得到最终结果^[13]。

在分析了神经网络模型的分类和发展基础上, 曹丹将Hopfield神经网络应用于脱机手写数字识别,建立了脱机手写数字识别系统的Hopfield神经网络模型^[14]。

对于传统的BP算法存在的一些局限，如学习率和动量因子在迭代过程不是变量，不能适应复杂的误差曲面，其收敛性对输入样本特性和连接权值的选取比较敏感，收敛速度往往相当慢；而且在学习过程中，经常陷入误差函数值局部极小状态，而达不到预定的收敛精度；北京邮电大学的陈彬彬在论文中通过引入自适应学习率及动量因子等对BP算法这些局限进行了一定程度的改进^[15]。

3.手写数字识别过程

手写数字识别问题中具体实现时的几个关键阶段及处理方法：

图1手写数字识别流程图

1、预处理阶段。鉴于数字的识别与色彩无关，并且要考虑到噪声的影响，将图像进行预处理。将原始的图像转换成识别器所能接受的二进制形式，其优劣直接影响着识别的效率。根据具体识别方案的不同，可以包括定位、二值化、去噪、切分、大小规格化等步骤。

2、特征提取阶段。

（1）结构特征

结构特征对于字符的精细结构反应灵敏,结构法能充分利用字符图形的结构信息及组成规律，减少笔画与字符形态变化的影响。结构法分辨相似字的能力较强。

①基于骨架的结构特征：这种特征的提取首先要将字符细化。细化常用一种模板迭代去除算法，即设计一些去除模板和保留模板，反复与字符的每一个像素进行匹配，将符合去除模板又不符合保留模板的像素点去掉，反复执行迭代过程，直到没有像素被去除为止。另外一种细化思路是直接细化，这种方法是根据每条扫描线的黑游程得到中轴，这种方法不会产生多余分枝。但是如果扫描方向与笔画方向不垂直就会产生大量断点。然后在细化的基础上提取点（包括端点、拐点(分点)、交叉点)、线（包括曲线、直线）和闭合圆等基元，送入相应的分类器进行识别。这种方法对噪声比较敏感，尤其是对于粘连、断笔的情况，效果不好。

②基于轮廓的结构特征：这种结构特征的提取不需要经过细化，直接在字符轮廓的基础上提取基元结构特征，与基于骨架的结构特征类似。

（2）变换特征

变换特征可以分为二维的变换特征和一维的变换特征。二维变换特征是在二维图像的基础上进行相应的变换，再提取变换特征。一维变换特征是将图像向和方向进行投X、Y影。将二维点阵变成一维数据，然后再作变换。

将数字字符形状转换为一组特征值的过程，其好坏决定着最终识别的效果。针对数字字符的端点，三度点，四度点，折点的个数与位置，横向切割交点序列，纵向切割交点序列等特征值，通过沿着轮廓点扫描的方法来实现。如下：

图2 数字4

当需要提取4这个字符的时候，需要在横向、纵向上确定字符的上下边界点。先确定左边界，再找到全1列（右边红线），以此类推确定上下边界。统一标准，提取特征向量。

3、识别阶段是利用提取到的特征，对待识别的数字字符进行识别处理。针对同一个数字，不同的人有不同的写法，目前数字识别算法有模板匹配、神经网络、BP神经网络等算法，每种算法都有各自的优点和缺点，要根据实际情况选择这些算法。

模板匹配其工作原理是：每一个手写体数字有一个模板，和待识别的数字的点阵图像距离最小的模板所对应的数字，就判定为输入的待识别的数字。模板匹配的关键在于模板设计。由于手写体人为因素太多，字形变化复杂，而模板又对尺寸、旋转、噪声等微小变化敏感，为了适应各种情况，必须为每一种可能的变形设计模板，设计任务繁重，而且测试速度慢。于是有人提出变形模板法。通过定义变形能量函数和数据不匹配能量函数来定义变形模型。这种变形模板法的优点是可以将分割和识别一起完成。但是这种对每一个模型反复变形的过程使得计算复杂、测试速度慢。

神经网络具有生物神经网络的某些特征，是一个信息处理的系统。神经网络结构简单、能够大规模并行、容易用硬件实现，并且具有学习和记忆能力。自适应和多样性等特征。但是计算量大，收敛速度慢。

参考文献：

[1]HunihikoFukushima. Recognitions for handwritten digit recognition[J]．Neurocomputing,2007,51:161-180.

[2] 张站．基于图像识别的阅卷系统的设计与实现[D]．合肥:安徽大学,2008．

[3] 张婷.基于图像识别技术的光学标记阅读机的研究与应用[D].合肥:安徽大学,2007. [4]Meng Shi,Yoshiharu Fujisawa,Tetsushi Wakabayashi.Handwritten numeralrecognition using gradient and curvature of gray scale image[J].PatternRecognition,2005,35:2051-2059.

[5] Ashraf Elnagar,Reda Ahajj.Segmentation of connectedhandwritten numeral strings[J].pattern Recognition,2008,38:625-634.

[6] 张重阳,娄震, 杨靖宇.基于轮廓和统计特征的手写体数字识别[J]. 计算机工程与应用,2004,3(9): 83-84,89.

[7] 朱学芳,石青云, 程民德.用BP网识别无限制手写数字的研究神经网络理论及应用,最新进展[M].武汉:华中理工大学出版杜 ,2004.

[8] DAN IEL SAGE, FRANCK R NEUMANN, FLORENCE HE2D IGER, etal. Automatic Tracking of Individual Fluorescence Particles: Application tothe Study of Chromosome Dy2namics [J]. IEEE Trans Image Processing, 2005:1372-1383.

[9] 宫淑兰.手写数字识别的研究与应用[D]. 济南：山东大学,2006

[10] 胡莹. 联机手写数学公式识别系统的研究与实现[D]. 广州：广州大学,2007.

[11] 董慧.手写体数字识别中的特征提取和特征选择研究[D]. 北京：北京邮电大学 2007.

[12] 宋婉娟.票据中手写数字识别的研究[D]. 武汉：华中师范大学,2007.

[13] 瞿海金.手写体数字识别方法的研究与实现[D].南京：南京理工大学,2005.

[14] 曹丹.基于Hopfield神经网络的脱机手写数字识别[D].长沙：中南大学,2009.

[15] 陈彬彬.高精度手写体数字的识别[D]. 北京：北京邮电大学,2006.

以上是毕业论文文献综述，课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

离线手写数字的识别文献综述

毕业论文课题相关文献综述

毕业论文课题相关文献综述

您可能感兴趣的文章

登录

毕业论文课题相关文献综述

毕业论文课题相关文献综述

您可能感兴趣的文章