毕业论文课题相关文献综述
文 献 综 述1.1研究的背景和意义随着互联网技术的迅猛发展,推荐系统已成为解决信息超载问题最重要的过滤工具,用以帮助用户在海量的数据中快速高效地找到有价值的内容。
但在实际应用中,由于产品种类和用户数目通常非常庞大,而传统的推荐系统往往运行于单机之上,受到单机的性能限制,已经远远不能够满足海量数据推荐计算的需要。
面对海量变化迅速的网络新闻用户面临的选择越来越多,在这样的环境下为了能更好地为用户推荐比较符合用户兴趣的新闻列表个性化新闻推荐系统成为网络新闻搜索领域的一项重要研究内容。
协作型过滤是至今为止应用最成功的个性化推荐技术具体做法是先利用用户的历史信息计算用户之间的相似性然后利用与目标用户相似较高的邻居对其他信息的评价来预测目标用户对特定信息的喜好程度根据这-喜好程度为目标用户推荐一个经过排名的推荐列表。
协同过滤推荐算法具有推荐新信息的能力不需要考虑信息的内容。
但依然存在用户关注度不断变化数据稀疏性等问题。
本文为了满足用户的需求使用协同过滤算法引入个人兴趣和场景兴趣用户是否选择了新闻推荐列表中新闻满足用户关注度的自适应性从而提高个性化新闻推荐系统的可扩展性和自动更新能力。
1.2研究的基础知识1.2.1 Hadoop运行机制和MapReduce编程原理通过对Hadoop运行机制和MapReduce编程原理的研究,结合对推荐系统与推荐算法,特别是对以物质扩散推荐算法和热传导推荐算法为代表的网络推荐算法的深入分析,设计和实现基于Hadoop平台的网络推荐算法MapReduce化编程实现方案,将该算法复杂的计算任务分解为一系 列MapReduce作业流程,以便于在Hadoop和云计算平台上进行分布式并行化处理,通过一系列实验测试证明算法在集群上具有良好的并行性和可扩展性。
1.2.2 Combiner函数在网络推荐算法的MapReduce 化方案的基础上,使用combiner函数、sequence file输入输出类型等优化方法,分析数据集的长尾分布数据特征和算法计算过程中的实现细节,提出通过在资源分配矩阵的计算过程中利用Pair 和Stripe方案以及对极度活跃用户进行剪切的优化设计思想,有效地解决算法的性能瓶颈问题,改进基于Hadoop的网络推荐算法的MapReduce方案,并通过实验测试证明改进方法可以进--步提高算法的效率。
.1.2.3推荐系统问题描述存在N个用户,编号u∈(1,2,..N),同时存在M个项目,编号i∈(,2...,M), r_mi表示用户u对于项目i的评分,这样用户对项目的评分就可构成评分矩阵R^(NM),其行标为用户编号u,列标为项目编号i。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。