支持向量回归方法及其在缺失值填补中的运用文献综述

 2021-09-25 20:24:23

毕业论文课题相关文献综述

文献综述

一、研究背景

20世纪90年代,Vapnik等人提出了支持向量机SVM(SupportVectorMachine)它建立在统计学习的VC维理论和结构风险最小原理基础上,较好地解决了小样本、非线性、高维数和局部极小点等实际问题。SVM不仅迅速发展为基于统计学习理论(StatisticalLearningTheory,简称SLT)的机器学习算法,而且成功地应用于分类、函数逼近和时间序列预测等方面。由于SVM通过寻求结构风险最小化来实现实际风险最小化和进行二次优化,因此,在样本量较少时,也能保证所得到的解为全局最优解。在工程领域中,缺失值填补的问题也可以看作一种对各种工程数据及其各个影响因子间的复杂的非线性函数关系的逼近问题。

随着信息技术的发展,越来越多的数据被存储到数据库中进行分析,数据挖掘技术就是一种从大量数据中挖掘出有效信息的重要方法。然而通常的数据挖掘方法均要求数据是完备的,也就是说数据库中的数据应该是不存在缺失值的,而这一点要求在实际生活中往往是很难满足的。比如学校里的学生数据库,往往会存在某些学生没参加考试导致某课程没有成绩的情况,这就导致了数据库表中往往存在空缺值。因此有效地进行缺失值填补对于数据挖掘起着至关重要的作用。

对于数据集合上的缺失值填补,以往的填补方法如:均值填补、全局常量填补或者基于决策树回归的缺失值填补方法均有一定的不足。均值填补和全局常量填补等方法由于不能很好地拟合原始数据而导致缺失值填补准确率上存在不足,基于决策树回归的缺失值填补方法则对于噪声过于敏感,缺失值填补准确率也受到了一定程度的影响。因此,研究高效准确的缺失值填补方法,对信息技术的发展起着至关重要的作用。

二、研究现状

目前SVM学习方法已经获得了广泛的应用,涉及到经济分析、生物识别技术,信号识别和预测、图像识别等多个领域。从最初SVM方法的简单应用研究,到多种方法的联合应用,互相取长补短,不断改进,获得了大量有价值的研究成果。

在回归方面,主要实验尚属于原理性研究,包括函数逼近、时间序列预测及电力负荷预测、信号或图像滤波等方面。支持向量机在高维空间中表示复杂函数是一种有效的通用方法,也是一种新的、很有发展前景的机器学习算法。

鉴于支持向量机可以有效地对原始数据进行拟合并且具有较好的抗噪声性能,因此研究基于支持向量机的数据缺失值填补方法,利用了支持向量机对数据良好的拟合与泛化能力,可有效地提高数据缺失值填补的质量。

三、支持向量回归的产生和发展

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。