基于拉普拉斯对抗网络的林木样本生成方法
- 课题介绍以及研究背景
森林,作为我国重要的陆地生态系统,在固碳释氧、保持水土、净化大气环境、积累营养物质、保护生物多样性方面起着重要作用。森林资源的精准获取与林木长势预估是森林资源培育经营和管理中的一项重要基础性工作,为林木的生长发育评估、营林造林策略、立地质量评价、林分收获模型等起到关键的数据支撑。然而,由于地貌景观各异、气候环境不同、森林植物种类多样、森林植物群落与林相各异[1],实践结果表明,依赖人工林地调研及不同尺度下的各类遥感手段在不同物候期、不同环境差异条件下的复杂林地分析依然存在精度不确定、依赖人工辅助、算法鲁棒性不强等问题。同时,林业的生长预测与收获估计主要依赖于前人在相关区域总结的理论生长回归模型[2],缺乏推广的普适性与模型参数的自适应修正,这都为林业的信息化管理与智慧经营带来挑战。
而我们在对森林中林木在进行机器学习时,根据处理问题的不同,所需要的训练样本不同,并不是所有的训练样本都可以在网络上搜索到,需要我们去进行一些实地的采集,使我们处理之后的数据更加贴近于现实,能够更好地运用于实际环境中去对林木进行处理,所以需要根据自己要解决的问题的实际需要,制作自己的样本数据集。而随着拉普拉斯金字塔LAPGAN[3]及基于不同尺度卷积操作的DCGAN[4]对的提出,使得我们可以生成比使用GAN生成的图片像素更高的图像训练样本。
- 国内外研究现状及比较
随着新一代人工智能技术不断取得应用突破,全球加速进入智慧化新时代,人工智能或将成为未来第一生产力,对各行各业都带来颠覆性变革。在林业领域,人工智能的应用既是智慧林业发展的重要举措,更为林业的精准管理、生态评估、碳汇计量、林权交易等应用提供新的创新发展机遇与科技驱动支撑。过去十年,随着计算机算力的不断提升,神经网络的层数也在不断加深,并能承担更复杂的预测与识别任务;同时,为了使得机器系统具备更强的学习能力和跨界知识的运用能力,各种新型的网络架构模型也依次出现。随着深度学习网络中有监督与半监督任务的不断增加,用户不仅要求模型对训练数据集有很好的拟合效果,同时也希望模型可以对同一规律的学习集以外的数据具有更好的适应能力,即泛化能力。因此,网络对训练样本的数量与质量提出了更高的要求,在此背景下,研究者期望能够用少量不需要标注的数据来训练通用系统以服务与其他任务模型。因此,自编码器(AutoEncoder)[5]在2006年被提出,其使用稀疏性原理来创建一个能够被用于重建输入图像的基本功能的最小网络,该网络可用于对训练样本开展降维、分类及去噪。2014年的生成式对抗网络(GAN)是近年来复杂分布上无监督学习最具前景的方法之一。该网络模型通过框架中两个模块:生成模型和判别模型的互相博弈学习产生用户所需要的影像数据。在当前的人工智能热潮下,GAN的提出满足了许多领域的研究和应用需求,同时为这些领域注入了新的发展动力。从机器理解数据的角度出发,建立的生成式模型一般不直接估计或拟合分布,而是从未明确假设的分布中获取采样的数据,通过这些数据对模型进行修正.这样得到的生成式模型对人类来说缺乏可解释性,但是生成的样本却是人类可以理解的,以此推测,机器以人类无法显式理解的方式理解了数据并且生成了人类能够理解的新数据。随后,结合拉普拉斯金字塔分解LAPGAN和基于不同尺度卷积操作的DCGAN在接下来的两年内被提出,其广泛应用于图像训练样本[6]的生成。
- 发展历史
现如今对生成式对抗网络GAN的研究提出,与其他生成式模型相比,GAN这种竞争的方式不再要求一个假设的数据分布,即不需要formulate p(x),而是使用一种分布直接进行采样sampling,从而真正达到理论上可以完全逼近真实数据,这也是GAN最大的优势[7]。然而,这种不需要预先建模的方法缺点是太过自由了,对于较大的图片,较多的 pixel的情形,基于简单 GAN 的方式就不太可控了。为了解决GAN太过自由这个问题,一个很自然的想法是给GAN加一些约束,于是便有了Conditional Generative Adversarial Nets(CGAN)。通过引入条件变量y(conditional variable y),使用额外信息y对模型增加条件,可以指导数据生成过程。如果条件变量y是类别标签,可以看做CGAN 是把纯无监督的 GAN 变成有监督的模型的一种改进。这个简单直接的改进被证明非常有效,并广泛用于后续的相关工作中,另一方面,为了改进 GAN 太自由的问题,还有一个想法就是不要让 GAN 一次完成全部任务,而是一次生成一部分,分多次生成一张完整的图片。DRAW 用了一种 sequential VAE 的模型,让机器一点点“写”出了一个个数字。于是之后有人提出的LAPGAN,则是采用了这样的思想,在 GAN 基础上做出了改进[8]。LAPGAN这个工作既有 project page,也有开源代码,是非常值得重视的工作。在实现sequential version的方式上,LAPGAN这个工作采用的是一种几十年前的拉普拉斯金字塔(Laplacian Pyramid) 的方式,也因此起名做 LAPGAN[3]。
- 总结
生成对抗网络Generative Adversarial Network在14年被Goodfellow提出后便热度不断,基于GAN的论文更是层出不穷,能够理解GAN也是本次课题的一个基础,要想了解GAN,我们就要明白其存在的意义,要解决什么样的问题。也有人提出过如果神经网络不能生成图像,就不能算得上真正理解了图像。因此GAN的应用也愈发的广泛,比如图像转换[9]、图像编辑等等。
虽然GAN很强大,但是在对于样本生成的时候像素较低,也会影响到之后的一些处理。原始的GAN网络是一个生成网络,一个判别网络,生成网络一般来说用一个符合高斯分布或者均匀分布的噪声作为网络的输入,生成图片,判别网络将生成网络的输出作为网络的输入进行判别是否真实。LAPGAN是建立在GAN和CGAN[10]的基础上,采用Laplacian Pyramid拉普拉斯金字塔[11]的方式,首先生成粗糙的图片,然后在粗糙图片的基础上,生成高分辨率的图片。我们将其运用到实际中的林木处理中,也可以协助我们更好地对森林林木进行样本生成。
参考文献:
[1] 陈建伟著摄 and 陈建伟, 多样性的中国森林. 中国林业出版社, 2010.
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。