1 国外研究现状
2019年四月莫勒图沃大学和悉尼大学的vinoj等人仅用200个样本就能得到当前最佳结果,发明了手写字符识别新模型TextCaps。[1]研究人员提出了一种用少量训练样本(每一类 200 个数据)训练胶囊网络的新技术,并在相同数量的测试样本上实现了当前最佳的性能。和当前最佳的系统相比,他们的模型只需要 10% 的数据就可以得到类似的结果;研究人员还提出并评估了解码器网络的几个变体,用不同的损失函数分析了解码器网络的性能,以提供组合损失函数的适当策略[2,3]。
Google的研究人员开发了基于循环神经网络的端到端手写识别系统,通过将输入笔画转为贝塞尔曲线序列进行分析处理,利用RNN得到了准确率更高的识别结果[4]。
2 国内研究现状
华北理工大学数学建模创新实验室的张岩等人研究出基于决策树和加权KNN混合算法的光学符号识别技术[5]。采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并且通过字符识别模型将图像中的文字处理成可编辑的文本格式.[6]研究人员首先对样本数据进行预处理,采用局部离群因子法剔除无效数据,通过信息增益率计算各个自变量相关性的强弱来找出恰当的特征,并将样本分为五类,建立决策树法和加权KNN算法相结合的混合算法,预测每类数据的结果并给出准确率,将结果中未识别的样本放在所有训练集下再次通过混合算法进行训练预测,最终总预测正确率达到了96.406%.最后通过混淆矩阵来评价模型,结果表明其拒识率较低,准确率较高,训练预测时间较短,具有可行性[7].
华南理工大学的卫晓欣发明提供了一种基于动态3D手写数字识别的虚拟人交互系统,包括手势与数字识别模块、中央服务器模块与虚拟人控制模块,所述手势与数字识别模块用于提取手部区间,识别手势及手写轨迹[8];所述中央服务器模块用于连接手势与数字识别模块和虚拟人控制模块,实现数据的采集,传输和命令发送;所述虚拟人控制模块为在实际中与人进行互动的载体,展示出虚拟人,根据从中央服务器模块接受来的命令,对虚拟人进行动作、语言、表情等操控,实现与人的交互[9]。
王卫华等人对现有手写数字识别难以处理几何变换下的识别难题,提出一种新的基于Grassmann流形度量的手写体数字识别方法[10]。在分析不同几何变换下的手写数字字符所构成的非线性流形空间结构基础上,定义了Grassmann流形及其距离度量,并通过计算待识别数字字符与训练字符集合构成的Grassmann流形距离实现手写数字字符的分类识别。
3 研究现状总结
OCR 字符识别技术经历了从印刷体识别到手写体识别的发展过程,按照字符字体
类型的数量可分为单体字符识别和多体字符识别,由于多体字符识别的复杂性要高于单体字符识别,其识别难度要远高于单体字符识别[11];按照字符有无上下文关系,字符识别又可分为联机手写识别和脱机手写识别,由于联机手写字符具有字符相应的笔画顺序、走向、数量以及书写速度等信息[12],因此,其识别难度要远小于脱机手写字符识别。目前联机字符识别的技术已经发展的相对成熟,并应用到一些相关的产品中[13]。
参考文献
[1] TextCaps : Handwritten Character Recognition with Very Small Datasets.arXiv:1904.08095v1 [cs.CV] 17 Apr 2019
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。