数字式电表自动识别
摘要:在经济与科技快速发展的当今时代,计算机、数据处理技术不断发展,图像识别技术经过不断的发展,图像识别是指计算机对图像进行处理、分析与理解,在日常生活、医学、建模等各个领域得到了广泛的应用,图像识别通过采集的数据进行提取分析训练,从而获得关键的信息,从而满足人们各种需求,同时人们也对该技术的应用要求越来越广泛与高效。为了能够学习表示高阶抽象概念的复杂函数,解决目标识别等人工智能方面的问题,需要引入深度学习,深度学习架构由多层非线性运算单元组成,较低层的输出将作为较高层的输入,由此从大量的输入的数据中学习有效的特征表示,学习到的高阶表示中包含输入数据的许多结构信息,可以用于分类、回归和信息检索等特定问题中。
目标检测是人工智能及深度学习中非常重要的一类任务,其目的是在一张图片中自动定位某个物体的位置并标注出该物体的类型。YOLO(You Look Only Once)算法是一种先进的实时物体检测的算法,速度更快,实时效果更好,虽然该检测算法已经非常优秀,但检测模型也相对较复杂,同时占用较大的存储空间,需要有力的图形处理器即GPU的计算资源支持才可以实现。
关键词:深度学习、YOLOv4卷积神经网络、目标检测
前言
深度学习的概念源于人工神经网络的研究,深度学习通过组合低层特征形成更加抽象的高层表示,从而发现数据的分布式特征表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。深度学习具有多层非线性映射的深层结构,可以完成复杂的函数逼近是深度学习的优势,并且深度学习理论上可获取分布式表示,即可通过逐层学习算法获取输入数据的主要变量,这样的优势是通过深度学习的训练算法完成的。由于深度学习可以很好的解决很多较为复杂的问题,近年来有很多人对其进行了深入的研究,出现了很多新的有关进展。
自然场景下的文字检测是计算机视觉和目标检测的基础研究之一,近年在深度卷积神经网络的推波助澜下快速的发展,其目的是给定一张图像,定位出其中的文字区域,并识别文字。相较于通常的检测,数字的识别具有不规则形状等特点。本目标检测系统使用yolov4算法,关于Yolov4的创新,在原有YOLO目标检测架构的基础上,采用了近些年CNN领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化,虽没有理论上的创新,但是会受到许许多多的工程师的欢迎,各种优化算法的尝试。Yolov4在Yolov3的基础上结合了非常多的小Tricks,整体检测思路是使用三个特征层进行分类以及回归检测。主干特征提取网络的改进点有由DarkNet53变为CSPDarkNet53,使用Mish激活函数,训练时用到Mosaic数据增强、Label Smooting平滑、CIOU、学习率余弦退火衰减。在特征金子塔部分,yolov4结合了两种改进,使用了SPP结构与PANet结构,SPP结构能够极大地增加感受野,分离出最显著的上下文特征。Yolov4的 mosaic数据增强参考了CutMix数据增强方式,理论上有一定相似性,根据论文所说其拥有的最大的优点是丰富检测物体的背景。
研究的目的及意义
近几年,深度学习应用于图像识别,减少了人力,高效且不费时,成为国内外图像识别技术的研究关键。Yolov3是目标检测Yolo系列非常经典的算法,Yolov4是Yolov3的改进版,在原有的Yolo目标检测架构的基础上,采用了近年来CNN领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等方面都有优化,虽然没有革命性的改变,但是Yolov4很好的结合了速度与精度,在实时目标检测算法中精度最高,实现了精度和速度的最佳平衡。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。