面向自动驾驶的三维激光雷达目标实时分割文献综述

 2022-01-18 20:59:23

全文总字数:7351字

摘 要:自动驾驶技术是学术研究的热点问题,激光雷达,以其优越的性能,使得它比其他传感器更受青睐,获得的点云数据也更便于后续的处理。因此,越来越多的研究将焦点放在点云数据处理,特别是基于深度学习的点云研究上。本文将从目前的研究现状进行综述,简要分析其中一些方法的对于某些特定场景中的不足,并针对目前自动驾驶的需求,对现有的优秀成果进行总结,在其基础上,提出了一些方法的可行性与合理性,简要分析当前对于基于3D LiDAR点云的实时道路目标分割的问题,并对其今后的问题提出合理性假想。

关键词:激光雷达;深度学习;目标分割

1 引言

近年来,以机器人技术和自动驾驶汽车为主要驱动力的智能汽车的研究得到了长足的发展,智能车被认定为下一代的移动终端,涉及多个新兴热门技术领域[1]。对于自动驾驶,自动驾驶系统依赖于对环境的准确、实时和强大的感知,自动驾驶汽车需要准确地分类和定位道路中与驾驶相关的物体,从最简单的概念上讲,就是利用传感器数据来识别如汽车、行人、骑自行车的人等其他障碍物的位置坐标。谷歌(Google)公司于2010年开始测试谷歌无人驾驶车辆(Google driverless car)。其定位是实现所有区域的无人驾驶,即无需任何人为干预的车辆驾驶。

激光雷达(Light Detection And Ranging, LiDAR)或激光扫描系统是一种非接触主动式的对地观测系统,LiDAR技术的发展使三维空间信息的实时获取取得了重大突破。由于激光具有高亮度性、高方向性、高单色性和高相干性等特点,因此激光雷达具有一系列独特的优点:角分辨率高、距离分辨率高、速度分辨率高、测速范围广、能获得目标的多种图像、抗干扰能力强[3]。这使得LiDAR技术在自动驾驶、高精度地图等领域都具有广泛的应用。

为全面了解当前对于3D LiDAR点云的处理方法,以及目前的需要,本文参考了近些年来的相关文献近30篇,并进行综述。

2 研究现状

3D LiDAR点云的特点

点云是在同一空间参考系下表达目标空间分布和目标表面光谱特性的海量点集合。有以下几个特点:

地面激光雷达技术结合了激光测量和摄影测量的特点,得到的点云包括三维坐标(X,Y,Z)、激光反射强度(Intensity)、颜色信息(RGB)

点云数据在形式上呈离散分布。“离散”是指数据点的位置、间隔等在三维空间中的不规则分布,.与数字影像像元间彼此独立的概念有所不同。这就意味着点云数据的相同平面坐标可以对应几个不同的高程值,从而有利于表现细节信息和变化剧烈的地形或变化快速的物体。另一方面,这种形式也有自身的不足,如同名点难以选取。

点云数据具有可量测性,可以直接在点云上获取三维坐标、距离、方位角、表面法向量,这对于我们进一步深层次处理提供了极大的便利。对道路中移动的物体,其移动速度的计算也有着非常优异的表现。

点云数据分布不均匀,其数据可能是稀疏的。

2.2 点云数据处理

目前,点云分割算法的研究主要分为传统算法和深度学习算法两个方向。传统算法根据其分割判别标准可分为基于边缘的点云分割、基于区域生长的点云分割[4]、基于数据本身属性的点云分割[5]、基于模型的点云分割和基于图的点云分割[6]等。而基于深度学习的点云语义分割主要是利用网络中编码解码结构实现对点云特征提取和分割操作[7]。深度学习在行人检测领域的表现和潜力,显然要远远好于传统方法。基于深度学习的行人检测方法具备极高的准确率和鲁棒性。这对于无人驾驶领域的发展有着重要意义。CNN模型在目标识别、检测上,具备更高的准确度[8]

对于二维卷积神经网络,是通过规则的卷积核来获取二维图像中相邻像素之间的内在联系。但由于三维点云中的点在三维空间中是无结构的、稀疏的、并且离散的。因此,如果要将卷积神经网络应用到三维点云分类中,往往要先要讲原始三维点变成规则的三维格网结构,然后应用三维卷积神经网络对规则化后的点云进行卷积、池化、反卷积等操作。[9-10]然而对于大范围的密集点云数据,这种方法的计算量和内存占用量将以三次方的速度增长。因此,对于道路中实时的数据传输和计算,这种方法消耗较大且运算较慢,并不能符合这特定场景中的要求。目前,CNN和CRF已经成功地应用于二维图像的分割任务[11-14],因此,通过将三维数据转换成二维是一种合适的处理思路。

对于道路中对3D LiDAR点云数据的处理,以前的方法包括或使用以下阶段的一部分:因知道目标类别(并且这些类别的集合相对较小),所以可以采用监督的方法。如果采用基于图的方法,将其应用在该问题中,并对于特定类别,解决二元分类任务,即首先将数据分为前景和背景,然后移除地面,将剩余的点聚类到实例中,从每个聚类中提取特征,并根据其特征对每个聚类结果进行分类——这种方法比直接解决多类问题的方法具有更好的性能[15-18]。虽然这种模式有很多优点,也很常见,但它有几个缺点:

上述的地面分割通常依赖于人工选择特征或决策规则——有些方法依赖于标量阈值,而其他方法则需要更复杂的特征,如栅格高程差法[19]、表面法线[20]或不变描述符[15],甚至后者需要进行预处理。

多级管道存在复合误差的聚合效应,上述的管道中的分类或聚类算法无法利用环境,最重要的是处理对象的直接环境。当遇到道路中复杂的环境,这些方法的结果可能并不理想

许多地面去除方法依赖于迭代算法,如RANSAC [21-22] (Random Sample Consensus)、GP-INSAC (Gaussian Process Incremental Sample Consensus)[23]或层次聚类[23]。这些算法的运行时间和精度取决于随机初始化的质量,因此性能可能不稳定。这种不稳定性对于许多应用场景如:自动驾驶等是不可靠不能接受的。因此,如果使用深度学习来提取特征,避开迭代算法是一种选择[24]

2.3 小型CNN架构——SqeezeNet

对于自动驾驶,特斯拉(Tesla)等公司会定期将新车型从服务器传输复制到客户汽车的电脑上。这种做法通常被称为无线更新。《消费者报告》(Consumer Reports)发现,特斯拉自动驾驶的半自动驾驶功能的安全性随着最近的无线更新(Consumer Reports,2016)而不断提高。然而,典型的CNN的无线更新需要大量的数据传输。使用Alexnet,这需要从服务器到汽车的240MB通信。如果采用较小的型模型,则需要的通信也较少,这使得频繁更新更为可行。

在提高关于深度神经网络精度上的研究中,对于一个给定的精度水平,通常可以通过识别多个CNN架构来达到该精度水平。在同等精度下,如果采用较小的CNN架构至少有三个优点:(1)较小的CNN在分布式的训练过程中需要的服务器间通信较少。(2)更小的CNN则也需要更少的带宽来从云端导出新模型到自动驾驶汽车上。(3)较小的CNN在FPGA等内存有限的硬件上调用更可行[25]。一种小型CNN架构——SqueezeNet很适合在这些场景中应用。

3结论

自动驾驶集自动控制、体系结构、人工智能、视觉计算等众多技术于一体,是计算机科学、模式识别和智能控制技术高度发展的产物,也是衡量一个国家科研实力和工业水平的一个重要标志,在国防和国民经济领域具有广阔的应用前景。研究。应当抓住这一机遇,借鉴现有的算法经验,在识别的准确性与快速性上做出改进提高,促进我国自动驾驶技术的进一步发展,在后人基于点云的实时目标分割的项目中,提供一定的借鉴意义。

参考文献

[1] 马建勇,刘宏骏.浅谈我国智能网联汽车发展环境[J].科技与创新,2017(02):1-2.

[2] 张新钰,高洪波,赵建辉,周沫.基于深度学习的自动驾驶技术综述[J].清华大学学报(自然科学版),2018,58(04):438-444.

[3] 梁冬梅. 激光雷达技术及其在自动驾驶领域的应用[J]. 汽车世界, 2019, 000(018):P.19-19.

[4] Wang Z, Liu H, Qian Y,et al.Real-time plane segmentation and obstacle detection of 3D point clouds for indoor scenes[C].European Conference on Computer Vision.

[5] 万燕,谭亮,龙文铮,唐洪泰.基于网格的三维彩色点云分割算法[J].东华大学学报(自然科学版),2014,40(04):481-485 496.

[6] Green W R,Grobler H.Normal distribution transform graph-based point cloud

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。