- 文献综述(或调研报告):
1、引言
传统的数据挖掘通常处理来自单个域的数据。在大数据时代,我们面临来自不同领域的不同来源的多样化数据集。这些数据集由多个模态组成,每个模态具有不同的表示,分布,比例和密度。如何从多个不同(但可能连接)的数据集中释放知识的力量在大数据研究中至关重要,这从根本上区分大数据与传统数据挖掘任务。这需要先进的技术,可以在机器学习和数据挖掘任务中有机地融合各种数据集的知识。
- 多模态数据关系数据库
构建多模态数据关系数据库,实现一个有效的多模态检索方式应该解决两个问题:(1)如何为不同的模态对象建立一个统一并且紧凑的可计算模型(2)如何有效的管理大规模的跨媒体多模态数据集。
3、基于语义的数据融合方法
在基于内容的多媒体信息检索领域,针对基于内容的视音频检索中的语义鸿沟问题,利用与视音频数据共生或共现的文本信息,进行多模态的语义分析和相似性度量,是克服语义鸿沟问题的一种十分有效的方法。基于语义意义的方法需要理解每个数据集的意义以及跨不同数据集的特征之间的关系。我们可以学习两个对象之间的多个相似性,每个对象都是根据一对相应的数据集计算出来的。这些相似之处可以相互加强,从而整合两个物体之间的相互关系。后者依次增强每个个体的相似性。 因此,它们是可解释的和有意义的。使用语义概念不仅可以更加的接近人类感知层面,而且有助于统一不同模态对象的特征。
4、多模态语义关联图
一个多模态语义关系图可以被表示为两个集合的二元组(M,E),其中M图中的定点集合,每个定点代表一个数据对象,E是图中边的集合,边表示两个数据对象之间的相似性(两对象属于同一模态时)或相关度(两对象属于不同模态时)。于是构建的语义关系图可以用一个相似矩阵R表示,矩阵中的元素代表了媒体对象之间的语义关联。
- 典型关联分析方法CCA
典型关联分析方法的只要原理是利用讲个变量集合的关联结构,其中一个表示独立变量集合,另一个表示非独立变量集合。然后优化两种变量之间的关联性,使得上述两种变量对应的潜在变量的线性关联度最大。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。