基于图像识别的电商同品鉴别系统
摘要:基于内容的图像检索(CBIR)的任务是通过对图像内容的分析来查找相似的图像,传统的CBIR任务使用人工提取特征,最近流行的CNN网络能够学习到丰富的中层图像特征,近似近邻查找方法(ANN)或者基于哈希技术来对检索进行加速,这些方法将CNN提取出来的高维特征映射到一个低维空间,然后生成紧凑的二进制字符串。这些方法大幅度减少了计算成本并且进一步优化了搜索的效率。
关键词:图像检索; 哈希技术; 卷积网络; 深度学习
一、文献综述
基于内容的图像检索(CBIR)的任务是通过对图像内容的分析来查找相似的图像,因此对CBIR来说,图像表征和相似度测量这两个工作至关重要。在这项研究方向上,一个最具有挑战性的问题是如何将像素级别的信息和人类能够感知的语义联系起来。尽管先前已经有一些手动提取特征的算法来表征图像,但是这些方法的效果一直不是很好。最近,深度学习的提出,打破了这一现象,近期研究表明,深度卷积神经网络(CNN)明显地大幅提高了各种视觉任务的效果,诸如对象检测,图像分类和细分等等。这些显著的成就得益于深层卷积神经网络(CNN)能够学习丰富的中间层图像特征。
有很多利用深度卷积神经网络(CNN)来学习图像特征的例子,比如,Krizhevsky等人利用了AlexNet中第七层的特征向量来进行图像检索,并且在ImageNet数据集上得到了很好的效果。因为CNN的特征是高维的,而且是直接去用4096个维度去计算两个特征向量的相似性,必然会导致计算速度的低下,Babenko等人提出了一个方法,他们使用PCA和区别降维,对CNN特征向量进行降维,并且因此收获了很好的效果。
在CBIR中,图像表征和恰当的计算成本扮演着很重要的角色,因为近年来视觉内容的增长,在大规模数据下的快速检索变成了一个刚需。很多研究已经回答了如何在大规模数据库下高效检索出相关数据,因为CNN的高维特征和其高计算成本,传统的线性查找方法并不适合在大规模数据下查找,有些人提出了使用近似近邻查找方法(Approximate Nearest Neighbor)或者基于哈希技术(Hashing Based Method)来对检索进行加速,这些方法将CNN提取出来的高维特征映射到一个低维空间,然后生成紧凑的二进制字符串。得益于这些二进制字符串的运用,通过二进制模式匹配或者汉明距离的测量等方法,快速图像检索才成为可能。这些方法大幅度减少了计算成本并且进一步优化了搜索的效率。此外,有些方法是两两比较的方法,此方法运用了一个相似性矩阵(包含两个图片数据的相似信息)来描述图像对或者数据对的关系,随后使用以上相似信息去训练得到一个哈希函数。总之,处理大规模数据集时,构建特征矩阵和生成二进制字符串是必不可少的。
机器学习
机器学习需要通过一些人工手段将自然界存在的原始数据转化为机器能够看懂的特征向量,因此机器学习领域缺少大量的人才来做数据清洗,数据分析,特征提取等工作。这些工作不但是低效的,而且没有足够的泛化能力和较强的鲁棒性。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。