细粒度图像分类文献综述
不同于粗类别的图像分类,细粒度图像分类(FGVC)需要分辨出具体的类别(例如粗类别只需要识别出某张图是鸟,而细粒度图像分类则需要识别出具体是那种鸟)。传统机器学习方法在解决细粒度图像分类问题时,需要对不同识别类型分别建模,设计不同的算法。而在基于深度学习[1]的方法兴起以来,由于卷积神经网络(CNN)在具有一定量的训练数据情况下,可通过反向传播(Back propagation)实现自动提取特征。此外,基于Imagenet[2]的预训练模型进行迁移学习(Transfer learning),是细粒度图像分类模型具有较强的鲁棒性,在一定程度上缓解了过拟合问题。基于以上背景,使得通用类型的细粒度图像识别模型的实现成为可能,并可具有较高的识别率。
细粒度图像分类在众多领域具有广泛的应用前景。例如,动植物识别不仅能够让普通人了解所看到的物种,也可以有效帮助动植物学家识别不不常见的物种。车辆识别则能够自动化的判断图片中的车型,品牌乃至出厂批次等。此外,瓜果素菜识别,毒蘑菇识别等皆具有较大的研究意义。要提高细粒度图像的识别效果,一方面依靠相关数据集的建立完善,另一方面也依靠分类算法模型的优化。
目前,国内外细粒度图像分类的研究主要基于两个方面展开:一是判别性特征学习(Discriminative feature learning),旨在寻找更好的特征表示方法;二是基于部分的注意力搜寻(Part based attention),旨在找到最具判别性的图像部分。
判别性特征学习:T. Lin et al[3]提出bilinear CNN结构,并在鸟类识别上取得当时最好的效果;X. Zhang et al[4]将CNN和Fisher Vector[5]结合,提高了对狗和鸟的识别效果;F. Zhou et al[6]探索了二分图(Bipartite-Graph)中的分类关系并在食物识别上取得了较好效果。
基于部分的注意力搜寻: 在较早的研究中,基于部分的注意力搜寻往往需要较强的监督,具体来说,就是需要人工标注框选位置(bounding box)[7][8][9]。但由于较多的人工干涉,使得这类模型难以推广。为解决这一问题,后续的研究引入基于弱监督的注意力模型。X. Liu et al[10]提出基于强化学习训练的全卷积注意力神经网络(Fully Convolutional Attention Network)。J. Fu et al[11]提出递归注意力卷积神经网络(recurrent attention convolutional neural network ),可以在多个尺度下找出可能的最具判别性的区域。
[1] Lecun Y, Bengio Y, Hinton G. Deep learning.[J]. Nature, 2015, 521(7553):436.
[2] Russakovsky O, Deng J, Su H, et al. ImageNet Large Scale Visual Recognition Challenge[J]. International Journal of Computer Vision, 2014, 115(3):211-252.
[3] Lin T Y, Roychowdhury A, Maji S. Bilinear CNN Models for Fine-Grained Visual Recognition[J]. 2015:1449-1457.
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。