图像分类,就是针对于一幅图像,在所给定的类别中,选出与该图像相匹配的类别作为输出的图像处理方法。图像分类属于图像处理领域的一个基本问题,是计算机视觉、机器学习与模式识别等领域非常活跃的研究方向,并具有多种实际应用,其中包括安防领域的人脸识别、行人检测等,交通领域的车牌检测与识别、逆行检测等,以及互联网领域的相片归类、图像检索等。鉴于图像分类在图像处理领域的重要地位,研究具有较强的鲁棒性和较高精确度的图像分类算法有着重要的理论意义和实际意义。
本课题主要研究的是基于SVM和卷积神经网络的混合系统来提高图像分类精度,其中涉及到支持向量机SVM、卷积神经网络CNNs、SVMCNN混合系统等。
SVM[1]是一种以统计学习理论为基础的用来解决二分类问题的机器学习算法。SVM是结构风险最小化模型,较好的解决了样本数量较小时的过拟合问题,有效提高了模型的泛化能力。在样本非线性可分的情况下,SVM将样本特征映射到高维,使样本在高维空间中线性可分,将难以求解的非线性问题转化为较容易求解的线性问题。且SVM引入了核函数,可高效计算高维向量的内积,有效降低了模型复杂度。由上文可知,SVM是解决二分类问题的模型,但是对于图像分类问题,图像的类别通常是多样的,即为多分类问题。因此需要构造合适的解决多分类问题的SVM模型[2][3],构造解决多分类问题的SVM模型主要分为直接法和间接法。
对于直接法,其基本思想是一次性考虑多个目标,并求解一个多目标函数的优化问题,一次性求得多个超平面将不同类别样本分隔开。如下图所示:
图1.一次性求得多个超平面将不同类别样本分隔开
但这种方法看起来简单,实际的计算复杂度很高,基本上不可能实现的。
对于间接法,主要是通过组合多个SVM模型来解决多分类问题。常见的方法有三种,如下:
- 一对多法(one-versus-rest)
假设样本分为k个类别,在每个类别样本与除了该类别的其余样本之间训练一个SVM分类器,则需要训练k个分类器。对于未知样本,将其依次输入到每个分类器中,若输出结果为正则输出对应类别。该方法的优点是规模较小,k个类别仅需调用k个分类器,分类速度较快。该方法的缺点是可能会出现多个分类器输出结果均为正或者所有分类器输出结果均为负,即可能会出现重叠或不可分的问题。
- 一对一法(one-versus-one)
假设样本分为k个类别,在每两个类别样本之间训练一个SVM分类器,则需要训练k(k-1)/2个分类器。对于未知样本,将其依次输入到每个分类器中并统计每个类别的得分,若输出结果为正则对应类别得分加1,最终输出得分最高的类别。该方法的优点是解决了一对多法中的不可分问题,并且在分类过程中如果某个分类器出现分类错误,通过统计得分输出类别的方法可将该错误修正,准确率跟高。该方法的缺点是当K值较大时需要调用的分类器太多,规模较大,分类速度较慢,并且仍然会出现重叠的问题。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。