基于用户偏好的新闻推荐系统的设计和实现文献综述
摘要:在信息化社会发展的越来越快的今天,筛选信息成了一个重要的课题。对于现代社会的人来说,每天上网接触的信息量非常巨大,并且有很大一部份的垃圾信息。如果能对这些信息进行科学的筛选,就可以节省大量寻找有效信息的时间,加快办事节奏。通过运用算法,统计用户感兴趣的新闻话题,针对这些偏好推送新闻,节省了用户挑选时花去的时间,提高了办事效率。在这次系统的设计中,主要使用了协同过滤算法,对用户的偏好进行筛选与过滤,并保存在偏好词库中,统计关键词出现的频度,便于在长期过程中对用户偏好进行更新汰换。
关键词:信息化 用户偏好 协同过滤
1.背景
随着互联网技术快速发展,网络信息量剧增的同时,其复杂程度也与日俱增。用户往往需要经历大量繁琐的搜索与筛选才能找所需要的信息。在对效率要求越来越高的现代,信息搜索的困难无疑大大拖慢了用户整体的效率。在此前提下设计一个有效的新闻推荐系统成为了一种加快用户效率的办法。
2.研究的目的与意义
在信息化社会发展越来越快的今天,信息量愈发庞大的同时,信息的获取也愈发困难。对于现代社会的人来说,每天上网接触的信息量非常巨大,并且有很大一部分的垃圾信息。每当用户想要搜索信息的时候总会被铺天盖地的信息流淹没,从中找到自己需要的信息成了搜索信息的过程中相对困难的一件事情。过去用户往往被信息的载体或是辨识拖慢办事效率,现如今信息俯首皆是,随之而来的困难则是对有效信息的充分挖掘。在处理信息之前,用户还要花费大量时间去甄选自己需要的信息,这在信息量相对较少而但更为集中的过去是无法想象的。
如果能对这些信息进行有科学有效的筛选,可以节省大量用户寻找有效信息的时间,在一定程度上加快了办事效率。首先是对用户经常搜索的关键词,在征得用户同意后对其进行采集和统计,把使用频度高的词语收集起来,包括但不限于形容词、人名、国家名、缩略词、时间、地点等。在收集到的样本的基础上对推送给用户的信息进行筛选,去掉无关信息和广告的同时,再对用户对推送内容的关注度进行采集,从而不断优化对用户兴趣点的把握,推送更多用户感兴趣的内容。
此外,为了避免“信息茧房”情况的产生,在基于关键词推荐的算法基础上,引入了基于多用户的协同推荐算法。在收集到更大规模的用户群数据后,把各人的偏好情况进行比对,在互相推荐偏好类信息的同时,再推荐一些个人独有的偏好信息给对方,以此测试用户的反应。如用户对他人的偏好产生了兴趣,则可以更多地对同类的信息进行推送,在一定程度上遏制了“信息茧房”的产生。不过为了避免在更大规模尺度上形成类似的“茧房”,不仅需要更大用户数量的支持,也需要更先进更有效率的算法的协助。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。