基于pointnet深度学习框架的林木点云单株分离文献综述

 2022-05-26 21:36:24

文献综述

点云是一种重要的几何数据结构类型。由于它的不规则的形式,在研究过程中常常会将这些数据转换为规则的3D voxel grids或者图片的集合。然而,这会使得数据变得十分庞大,并且造成许多问题。由此文献中提出了一种新型的、直接在点云数据上应用深度学习模型的方法处理点云数据的深度学习模型——PointNet,并验证了它能够用于点云数据的多种认知任务,如分类、语义分割和目标识别。

一、林木点云单株分离的理论基础

点云数据是在欧式空间下的点的一个子集,它具有以下特征:

·无序性:点云数据是一个集合,对数据的顺序是不敏感的。这就意味这处理点云数据的模型需要对数据的不同排列保持不变性。查阅到的文献中使用的方法包括将无序的数据重排序、用数据的所有排列进行数据增强然后使用RNN模型、用对称函数来保证排列不变性。由于第三种方式的简洁性且容易在模型中实现,所以我们可以使用第三种方式,既使用最大池化(max pooling)这个对称函数来提取点云数据的特征。

·点之间的空间关系:一个物体通常由特定空间内的一定数量的点云构成,也就是说这些点云之间存在空间关系。为了能有效利用这种空间关系,必须将局部特征和全局特征进行串联的方式来聚合信息。

·不变性:点云数据所代表的目标对某些空间转换应该具有不变性,如旋转和平移。所以我们可以先将点云减去质心,然后训练一个 spatial transformer network 得到一个归一化旋转矩阵,将其施加在点云上就可以了。

定理一:证明了PointNet的网络结构能够拟合任意的连续集合函数。其作用类似证明神经网络能够拟合任意连续函数一样。同时,作者发现PointNet模型的表征能力和maxpooling操作输出的数据维度(K)相关,K值越大,模型的表征能力越强。

定理二:说明对于任何输入数据集S,都存在一个最小集Cs和一个最大集Ns,使得对Cs和Ns之间的任何集合T,其网络输出都和S一样。这也就是说,模型对输入数据在有噪声(引入额外的数据点,趋于Ns)和有数据损坏(缺少数据点,趋于Cs)的情况都是鲁棒的。说明了最小集Cs的数据多少由maxpooling操作输出数据的维度K给出上界。换个角度来讲,PointNet能够总结出表示某类物体形状的关键点,基于这些关键点PointNet能够判别物体的类别。这样的能力决定了PointNet对噪声和数据缺失的鲁棒性。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。