基于复杂网络的在线婚恋交友大数据分析文献综述

 2021-10-19 22:40:28

毕业论文课题相关文献综述

1. 研究背景和意义大数据是时下热门的话题,具有全局性、并行高效性、鲁棒性、收敛速度快、收敛精度高和通用性等优点的智能算法在当今世上各个领域都已得到应用,而如何进一步对这些算法进行改进、优化、创新进而产生更大的作用是值得每一位研究者深入钻研的。

文献[9]对复杂网络进行了大体的描绘和解释,基于复杂网络模型建立大数据分析的系统级模型,建立多要素及其间相互作用关系的形式描述和可计算的模型,可将大数据分析问题转化为复杂网络的性质分析,从而能够使用复杂网络来分析解决生活中的实际问题。

在这个科技不断发展,生活压力不断上升的时代,有的人忙完了学业忙事业,勤勤恳恳地打拼却因为忙碌或是自负而忘了去好好追寻生命的另一半,有的人深陷于网络的便利,饮食、缴费、购物、社交都能坐在家里解决,享受足不出户的好处的同时却反而导致了性格日渐腼腆孤僻,交际圈狭窄,等到了该谈婚论嫁的年纪才发现已经无从下手。

由于诸如此类的种种原因,各类婚恋交友网站(如世纪佳缘,珍爱网等)应运而生,文献[12][16]指出,越来越多的人开始偏向于选择这种便捷高效的择偶渠道,而如何运用用户数据库中数量庞大且种类繁多的信息来了解婚恋交友行为的相关特征,提高适婚男女的在线匹配成功率和满意度成为各大婚恋交友网站面临的难题。

婚恋网站用户之间的关系可以抽象成一种在线社会网络,据文献[1]至[3]所述,为应对这种及其复杂的关系网络,可以运用多子网复合复杂网络模型来实现对多类个体间多种关系的描述,基于这些关系通过机器学习分析出用户特征,挖掘出其中的机理规律,从而进行用户匹配和推荐。

文献[4]至[7]阐述了样本统计和复杂网络分析方法,文献[9]-[11]及[13]-[14]介绍了样本的组织、聚类方式以及复杂网络的构建。

本课题将以大数据作为依据,以复杂网络为技术手段,分析在线婚恋交友网站用户间的关注及互动行为,并提出高匹配度和满意度的婚恋推荐算法,旨在为提高综合匹配效率找到一种可行方案。

2.当前研究现状以世纪佳缘为例,它的最终呈现到用户面前的推荐列表主要经过了两大环节:一是基于图算法产生候选集,产生推荐,二是对产生的推荐进行排序,将匹配成功率较高的放在前排显示。

2.1.基于图算法产生候选集世纪佳缘的图算法是基于Spark GraphX实现的,GraphX是一个计算引擎,提供了强大的计算接口,它允许用户将数据当成一个图或是一个集合,从而极大简化了复杂操作,提高了运行效率。

此外,主要运用了SVDFeature、Liblinear等工具包来进行数据处理,用Hive作为数据仓库,用Kafka处理消费者在网站中的所有动作流数据。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。