一. 研究背景及意义
中国是一个农业大国,自古以来地域辽阔,资源丰富。农业生产对中国的意义不言而喻。但是,随着农业生产方式的改革,农作物病虫害的发生频率逐渐增加。病虫害作为农作物的重大灾害,不仅造成农作物减产甚至失败的严重后果,也给我国农业发展带来了沉重打击。因此,如何准确,快速地识别出农作物病害的种类并及时提供防治措施预警信息是提高农作物产量,确保质量和安全的关键环节,与“三农问题”息息相关,直接关系到区域农业生产和农村经济发展。传统的人工检测病虫害的方法完全取决于农民的观察经验,或邀请专家上门指导。这种方法速度慢,效率低,成本高,主观性强,准确性低,没有及时性。[1]
“智慧农业”依托固定监控相机、移动装备及机器人、智能手机等终端构建的物联网体系,在实时采集获取大量高质量病虫害图像数据基础上,研究基于深度学习、迁移学习等方法的分类检测网络,可高效率、低成本地为广大农业生产者提供精准、可靠、实时的病虫害识别结果,逐渐成为国内外共同关注的研究焦点。[2]
随着机器学习和人工智能的不断成熟,越来越多的学者试图将现代信息技术与农业深度融合,这为农作物病虫害识别提供了新的方法和思路。使用高效的图像识别技术可以提高图像识别的效率,降低检测成本,并提高识别的准确性。因此,国内外的专家学者进行了大量的研究,其中深度学习已成为研究的重点。农作物病害图像处理技术主要用于疾病诊断研究,包括图像分割,特征提取,疾病识别等。尽管当前的图像识别技术已经取得了良好的识别效果,但是仍然有很多问题需要解决。未来,图像识别的研究方向应该集中在农田中随机发现的具有复杂背景的病虫害图像,完善现有算法,并利用深度学习的优势来学习识别具有复杂背景和模糊图像的图像。利用图像识别技术帮助农民或种植者发现病虫害,对保证农业生产和促进农业经济发展具有重要意义。
自深度学习(DeepLearning)的概念提出以来,基于深度学习的特征提取、识别方法受到了极大关注,并在自然图像分类、识别中得到了成功应用。[3]深度学习的核心思想是采用数据驱动的方式,通过一系列的非线性变换,从数据中自动地提取多层特征表示[4]。尽管深度学习模型能够自动地学习特征,且具有较高的识别精度,但随着研究的深入,深度学习仍存在局限性,如模型复杂度高、缺乏反馈机制等,且实现较高识别精度工作的前提是需要海量的标签化数据通过大量的计算构建一个有效的模型,当数据集中含有少量标签的情况下,利用深度学习算法对数据的规律预测可能造成偏差,效果可能不优于一些已有的简单的机器学习算法。
二.国内外研究概况
作为机器学习中一个热门的研究方向,迁移学习已被广泛应用于自然语言处理、文本挖掘、图像分类和聚类、视频帧识别、医疗健康及生物信息学等诸多领域[5],用于解决目标领域中含有少量标签数据甚至没有标签数据的问题。
迁移学习的相关概念最早于1995年召开的神经信息处理大会(Advances in Neural Information Processing System,NIPS95) 提出,此次大会开展了关于“学会学习” (Learming to Leam)的专题讨论会,对机器学习领域中迁移学习的根本动机进行了探讨,并对“保留并再次使用过去学到的知识”这种机器终身学习方法的必要性进行了集中探讨[6]。2005 年,美国国防高级研究计划署(Defense Advanced Research Projects Agency, DARPA) 的信息处理技术办公室对迁移学习进行了新的定义:“让系统能识别出过去学到的知识和技能并将之用于新的任务”[7] 。 2007年,Dai 等将Boosting算法扩展到迁移学习中,提出了著名的TrAdaBoost算法,引入辅助空间,将辅助空间中有助于目标任务的样本以不同权重的形式添加到目标域样本集中,并将该方法应用到文本分类中,提高了分类模型在目标 领域数据上的准确性。2011年,Yang 在《知识的自动发现》一文指出,利用迁移学习技术可以进行知识的自动发现,使计算机有联想、借鉴和类比功能,做到举一反三。 2011年,Pan等提出了迁移成分分析(Transfer Component Analysis,TCA)方法,针对源域和目标域数据分布存在差异时,同时将两个领域的样本映射到一个高维的空间中,并在此空间中在最大程度地保留两个域中内部属性的同时,最小化源域和目标域的分布距离,在一定程度上解决了域适应问题。2015年,Tan等提出了传递性迁移学习(Transitive Transfer Learning),在源域和目标域直接共享少量因素的情况下,传递知识。2015年, Zhang[8]等将典型性相关分析引入迁移学习中,提出了一种基于跨领域典型相关性分析的迁移学习方法,在保持各领域的特有特征和所有领域共享特征相关性的前提下,选择适当的基向量组合训练分类器,使得降维后的特征仍具有相似的判别性,提高了跨领域迁移的分类准确率。
迁移学习能够借助已有领域的知识解决目标领域的学习问题,具有资源利用率高、节省人工标注成本等特点,而深度学习方法具有较高的识别精度且模型具有较好的可迁移性,因此研究人员越来越多地将迁移学习与深度学习相结合,称为深度迁移学习。深度迁移学习是通过基于某一个领域训练和学习到的具有一定泛化能力的深度网络模型迁移至,另一特定的领域中,根据新的任务对模型进行调整,在不需要大量标签数据的前提下,实现深度学习在某一领域的应用。当前深度迁移学习有两个研究热点:基于深度网络的迁移学习和基于生成式对抗网络(Generative AdversarialNetworks,GAN ) 2014年,Yosinski 等( Yosinski et al,2014)发表《How transferable are features indeep neural networks?》一文,通过进行一系列实验,在理论上证明了深度神经网络的可迁移性,并指出迁移另一网络的参数比随机初始化效果好。2014 年,Tzeng 等首次提出了一种深度域混淆(DeepDomainConfusion,DDC)方法,用于解决深度网络的自适应问题(Tzeng etal, 2014)。2016年,Ganin等(Ganin etal, 2016) 首先在神经网络中加入了生成-对抗机制,并提出了域适应神经网络(Domain- Adversarial NeuralNetwork,DANN)。2016 年,Long (Long et al,2016) 提出了联合适应网络( JointAdaptationNetwork,JAN),提出了JMMD(JointMMD)度量,在深度网络中同时进行联合分布的自适应和对抗学习,将只能对数据进行自适应的方式推广到对类别的自适应。2017年,Cao等(Caoetal.,2017)提出了选择性对抗网络(SelectiveAdversarial Networks,SAN)用于解决选择性迁移的问题,通过概率权重判别器避免选择性迁移情况下负迁移的问题。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。