PointNet :度量空间中点集的深层次特征学习
摘要:以前很少有人研究点集的深度学习。 PointNet [20]是这方面的先驱。但是,根据设计,PointNet不会捕获由度量空间点所引发的局部结构,从而限制了识别细粒度模式的能力以及对复杂场景的普遍性。在这项工作中,我们引入了一个分层神经网络,它将PointNet递归地应用于输入点集的嵌套分区。通过利用度量空间距离,我们的网络能够通过增加上下文比例来学习局部特征。通过进一步观察,通常采用不同密度对点集进行采样,这导致对均匀密度训练的网络的性能大大降低,我们提出了新的集合学习层,以自适应地组合来自多个尺度的特征。实验表明,我们的网络PointNet 能够高效,稳健地学习深度点集功能。特别是,在具有挑战性的3D点云基准测试中,结果明显优于现有技术
- 介绍
我们感兴趣的是分析几何点集,它是欧几里得空间中的点集合。 特别重要的几何点集类型是由3D扫描仪捕获的点云,例如来自适当配备的自动车辆。 作为一个集和,这些数据必须对其成员的排列不变。 此外,距离度量定义了可能表现出不同属性的局部邻域。 例如,点的密度和其他属性在不同位置可能不一致 - 在3D扫描中,密度变化可能来自透视效应,径向密度变化,运动等。
以前很少有人研究点集的深度学习。 PointNet [20]是一项直接处理点集的开创性工作。 PointNet的基本思想是学习每个点的空间编码,然后将所有单个点特征聚合到全局点云签名。 通过其设计,PointNet不能捕获由度量引起的局部结构。 然而,利用局部结构已证明对卷积体系结构的成功很重要。 CNN将在常规网格上定义的数据作为输入,并且能够沿着多分辨率层次以越来越大的尺度逐步捕获特征。 在较低水平,神经元具有较小的感受野,而在较高水平,它们具有较大的感受野。 沿着层次结构抽象局部模式的能力允许更好地概括到看不见的情况。
我们引入了一个名为PointNet 的分层神经网络,以分层方式处理在度量空间中采样的一组点。 PointNet 的一般概念很简单。 我们首先通过底层空间的距离度量将点集划分为重叠的局部区域。 与CNN类似,我们从小区域中提取捕捉精细几何结构的局部特征; 这些局部特征进一步分组为更大的单元并进行处理以产生更高级别的特征。 重复此过程,直到我们获得整个点集的特征。
PointNet 的设计必须解决两个问题:如何生成点集的分区,以及如何通过本地特征学习器抽象点集或局部特征。 这两个问题是相关的,因为点集的分区必须跨分区产生公共结构,因此可以共享局部特征学习者的权重,如卷积设置。 我们选择我们的本地特色学习者为PointNet。 正如该工作所证明的那样,PointNet是一种有效的架构,用于处理语义特征提取的无序点集。 此外,该架构对输入数据损坏很稳健。 作为一个基本构建模块,PointNet将一组本地点或特征抽象为更高级别的表示。 在此视图中,PointNet 以递归方式将PointNet应用于输入集的嵌套分区。
仍然存在的一个问题是如何生成点集的重叠分区。 每个分区被定义为底层欧几里德空间中的邻域球,其参数包括质心位置和比例。 为了均匀地覆盖整个集合,在通过最远点采样(FPS)算法设置的输入点中选择质心。 与使用固定步幅扫描空间的体积CNN相比,我们的本地感知域依赖于输入数据和度量,因此更有效和有效。
然而,由于特征尺度的纠缠和输入点集的不均匀性,确定局部邻域球的适当比例是更具挑战性但有趣的问题。 我们假设输入点集在不同区域可能具有可变密度,这在实际数据中非常常见,例如结构传感器扫描[18](参见图1)。 因此,我们的输入点集与CNN输入非常不同,CNN输入可以被视为在具有均匀恒定密度的常规网格上定义的数据。 在CNN中,本地分区比例的对应部分是内核的大小。 [25]表明使用较小的内核有助于提高CNN的能力。 然而,我们对点集数据的实验反驳这一规则。 由于采样不足,小邻域可能包含太少的点,这可能不足以允许PointNets强大地捕获模式。
我们论文的一个重要贡献是PointNet 利用多个尺度的邻域来实现稳健性和细节捕获。 在训练期间辅助随机输入丢失,网络学习自适应地加权在不同尺度下检测的模式,并根据输入数据组合多尺度特征。 实验表明,我们的PointNet 能够高效,稳健地处理点集。 特别是,在具有挑战性的3D点云基准测试中,已经获得了明显优于现有技术的结果。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。