基于深度学习的汽车目标检测文献综述

 2022-01-26 22:43:58

全文总字数:4875字

  1. 研究背景及意义

近年来,随着我国社会生产力的发展,汽车逐渐代替自行车成为了人们日常出行的主要代步工具,智能驾驶也逐渐进入到人们的视野。智能驾驶不仅可以解放人们的双手,精确地路况识别和车辆控制系统可以有效地防止不文明驾驶和交通事故的发生。人工智能技术也在发展中逐步完善,鉴于人工智能的快速发展,以及深度学习不断取得进步,深度学习己经广泛应用于计算机视觉,模式识别领域,数据挖掘等等。汽车目标识别系统也是人工智能的又一种应用,设计一套高效、准确的系统无疑是对智能驾驶及车辆监控系统非常有意义的。

  1. 国内外课题研究现状

目前基于深度学习的目标识别算法主要分两类。第一类是传统的基于人为特征提取和分类器的结合[1],这种方法实际上还是需要大量人工的参与特征设计以及提取,人为决定要提取的特征,然后通过分类器或浅层神经网络进行分类。主要提取的特征类型有:局部二值模式( LBP)、梯度方向直方图( HOG)、Gabor[2]等,然后将这些特征以特征向量的形式输入到一个传统的分类器比如 SVM、Ada Boost、决策树等进行分类。这种方法的关键是特征和分类器的选择,这两方面耗费了研究人员的大量精力。但是这种方法一定的局限性,对图像质量要求较高,鲁棒性较差。

第二类是近几年出现的基于卷积神经网络的目标识别算法[3],代表算法有 Mask R-CNN、YOLO SSD等。与传统的目标识别算法相比,基于深度学习的目标识别具有以下优点[4]

  1. 需要人为地提取特征器通过自己的学习可以从图像中提取特征,比人为设定特征的特征更加有效。
  2. 可以识别的信息更多,例如目标在图像中的位置信息。这种方法在精确度和速度上比传统的方法要高,并且具有较高的鲁棒性。

20 世纪 60、70 年代,美国的一些学者已开始研究图像处理技术在交通控制中的应用,但由于技术的限制,在当时无法获得令人满意的结果。美国明苏达大学运输研究中心研发了车辆检测系统(AUTOSCOPE)[5],该项成果是由帕诺斯·麦克鲁波洛斯博士在 1984年领导完成的,这是世界上最早将图像处理技术应到交通控制中的系统。随后,欧洲、日本、美国分别投入大量人力、物力、财力并相继推出交通视觉产品,使视频处理技术在智能交通中得到了很好的发展。英国的雷丁大学早在上个世纪 90 年代就对行人和车辆的跟踪进行研究并在其交互作用识别方面取得显著成果[6]。1999 年欧盟 Framework 5 程序委员会设立重大项目ADVISOR(Advanced Vehicle Simulator,高级车辆仿真器)系统[7]。该项目是在人群和个人的行为模式分析、人机交互等研究基础之上,开发一个应用在地铁、机场等公共交通场合的安全管理系统。1996年,车辆信息与通讯系统VICS(Video Investigation Combat System)率先在日本投入使用。目前,世界上已经形成了美国、日本、欧盟三大ITS(Intelligent Transport System)研究开发基地,除此之外,亚洲的韩国、新加坡和我国的香港特区ITS发展水平也较高。

从20世纪90年代开始,国内开始发展ITS。闯红灯自动监视系统是当前比较广泛、成熟的 ITS 应用产品。通过在图像处理算法上的研究,有几家公司在交通检测方面推出了各自的视觉交通检测产品,并在实际中得到了一定应用,但由于属于起步阶段还无法形成系列产品。自动交通视觉监控系统(VISATRAM)[8]是清华大学将视觉交通检测的研究成果应用到中国公路交通的高科技研究产品。台湾国立交通大学电机与控制工程学系智能控制系统集成实验室开发了独立式实时图像跟踪系统[9],对交通视频图像中的车辆进行检测和跟踪。西安交通大学人工智能与机器人研究所车辆课题组搭建了一个基于智能辅助驾驶的 Spring Robot 平台[10],并在此平台之上研发了道路偏移报警系统和前向避障辅助系统。

视频目标的检测和识别是计算机视觉领域中最重要的,也是最基本的任务。它是把图像处理、自动控制、信息科学有机结合起来,形成一种能从图像信号中实时地自动检测、识别出目标,并可进一步提取目标位置信息[11],自动跟踪目标运动,对目标进行行为分析的系统。智能交通的视频目标检测和识别是对运动车辆、步行的人或其他交通监控下的物体进行提取、分类。其目标检测就是要将视频中的运动物体分割出来,如汽车、行人等,为下一步的目标识别和跟踪提供关键的信息。而目标识别主要是对交通场景中的行人、不同类型的车辆等交通监控下的运动物体进行分类,以便用于目标的行为分析,例如车辆行为异常、车辆和行人闯红灯等交通状态检测。

虽然视频目标的检测与识别技术已经发展了几十余年,但它仍然是一个热点研究领域。期刊方面以CVI(Computer Vision and Image Understanding)、PAMI(IEEE Transactions Pattern Analysis and Machine Intelligence)、IJCV(International Journal of Computer Vision)、TIP(IEEE Transactions on Image Process)、MVA(Machine Vision and Application)、PR(Pattern Recognition)等为主要代表,会议方面以 ECCV(European Conference on Computer Vision)、CVPR(IEEE Computer Society Conference on Computer Vision and Pattern Recognition)、ICCV(International Conference on Computer Vision)、ICPR(International Conference on Pattern Recognition)、ICIP(International Conference on Image Processing)、BMVC(British Machine Vision Conference)等为主要代表[12],当前视频目标检测和识别的研究热点和进展都可以在它们的报道中得以反映。

国外一些大学和研究所,如剑桥大学、牛津大学、麻省理工大学、卡内基梅隆大学、斯坦福大学、多伦多大学、大阪大学、瑞典皇家工学院等都有相应的研究小组或实验室,都对视频目标的检测和识别进行了大量的研究,并在实际应用中取得了较好的效果。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。