基于深度学习的细粒度图像分类问题的研究文献综述-文献综述网

细粒度图像分类文献综述

不同于粗类别的图像分类，细粒度图像分类(FGVC)需要分辨出具体的类别（例如粗类别只需要识别出某张图是鸟，而细粒度图像分类则需要识别出具体是那种鸟）。传统机器学习方法在解决细粒度图像分类问题时，需要对不同识别类型分别建模，设计不同的算法。而在基于深度学习[1]的方法兴起以来，由于卷积神经网络（CNN）在具有一定量的训练数据情况下，可通过反向传播（Back propagation）实现自动提取特征。此外，基于Imagenet[2]的预训练模型进行迁移学习(Transfer learning)，是细粒度图像分类模型具有较强的鲁棒性，在一定程度上缓解了过拟合问题。基于以上背景，使得通用类型的细粒度图像识别模型的实现成为可能，并可具有较高的识别率。

细粒度图像分类在众多领域具有广泛的应用前景。例如，动植物识别不仅能够让普通人了解所看到的物种，也可以有效帮助动植物学家识别不不常见的物种。车辆识别则能够自动化的判断图片中的车型，品牌乃至出厂批次等。此外，瓜果素菜识别，毒蘑菇识别等皆具有较大的研究意义。要提高细粒度图像的识别效果，一方面依靠相关数据集的建立完善，另一方面也依靠分类算法模型的优化。

目前，国内外细粒度图像分类的研究主要基于两个方面展开：一是判别性特征学习（Discriminative feature learning），旨在寻找更好的特征表示方法；二是基于部分的注意力搜寻（Part based attention），旨在找到最具判别性的图像部分。

判别性特征学习：T. Lin et al[3]提出bilinear CNN结构，并在鸟类识别上取得当时最好的效果；X. Zhang et al[4]将CNN和Fisher Vector[5]结合，提高了对狗和鸟的识别效果；F. Zhou et al[6]探索了二分图（Bipartite-Graph）中的分类关系并在食物识别上取得了较好效果。

基于部分的注意力搜寻: 在较早的研究中，基于部分的注意力搜寻往往需要较强的监督，具体来说，就是需要人工标注框选位置（bounding box）[7][8][9]。但由于较多的人工干涉，使得这类模型难以推广。为解决这一问题，后续的研究引入基于弱监督的注意力模型。X. Liu et al[10]提出基于强化学习训练的全卷积注意力神经网络(Fully Convolutional Attention Network)。J. Fu et al[11]提出递归注意力卷积神经网络(recurrent attention convolutional neural network )，可以在多个尺度下找出可能的最具判别性的区域。

[1] Lecun Y, Bengio Y, Hinton G. Deep learning.[J]. Nature, 2015, 521(7553):436.

[2] Russakovsky O, Deng J, Su H, et al. ImageNet Large Scale Visual Recognition Challenge[J]. International Journal of Computer Vision, 2014, 115(3):211-252.

[3] Lin T Y, Roychowdhury A, Maji S. Bilinear CNN Models for Fine-Grained Visual Recognition[J]. 2015:1449-1457.

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

以上是毕业论文文献综述，课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

基于深度学习的细粒度图像分类问题的研究文献综述

您可能感兴趣的文章

登录

您可能感兴趣的文章