文献综述
在信息时代中,获取信息越来越容易,各类信息数据也在爆炸式增长,这些结构复杂的数据的处理变得非常困难,因为这些数据通常以非线性、非结构的形式存在与高维空间中。在模式识别、数据挖掘和计算机视觉的很多实际问题中,数据都表现出高维数的特点,数据高维性的特点掩盖了数据的本质特征。高维数据,意味着数据需要多于两个或三个维度来表示,一般很难被解释。一种简化的方法是假设数据嵌在高维空间的一个非线性流形上。如果这个流形维数足够低,那么数据可以在低维空间中被可视化。因此,对高维数据进行降维,将其用简洁的低维数据表示,从而提取隐藏在高维表象下有用的和感兴趣的知识显得尤为重要。流形学习的目的是在不依赖诸多先验假设(如观测变量之间相互独立,分布近似正态等)的情况下,直接寻求隐藏在高维观察空间中的低维非线性数据结构与性质,完成或协助完成数据挖掘、机器学习、模式分类等各项任务。以及解决非监督学习的两个问题:1.寻找可靠的特征提取函数,提取数据集的可靠特征,并且在面临未见过的数据时保持特征稳定 2.寻找对数据集的描述模型,即建立数据分布模型(可能是非常粗糙的)。
ISOMAP实在多维尺度分析基础上的一种非线性维数约简方法。MDS算法是一种线性映射方法。经过这种映射,原始数据点之间的欧氏距离可以在低维空间近似保存下来。
MDS所要求的的目标函数:minphi;(Y)=
或者为:
针对非线性数据,欧氏距离的点与点特性不能完全表明位置关系,所以在ISOMAP算法引入了测地距离来权衡点点之间的相互关系。当与是k近邻时,它的测地距离为它们的欧氏距离,不然测地距离就是在流形上的最短路径距离。
ISOMAP算法:第一步:构建近邻图
定义一个包含所有样本点的图G,如果样本与的欧氏距离d(,)小宇一个域值ε或者是的k近邻点,那么这两个点有边连接,且边长为;
第二步:计算最短路径
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。