全文总字数:3697字
文献综述
文 献 综 述一﹑系统开发的背景及意义随着互联网行业的飞速发展,技术的发展日新月异,互联网从业者需要紧跟潮流,才能不被新势力淘汰,为了帮助互联网从业者轻松获得最新,最全,最有含金量的技术文章,了解互联网行业的时事新闻,一个数据驱动的新闻推送平台是不可或缺的。
新闻推送微服务平台收集时事新闻,同时邀请权威的撰稿人和自媒体人入驻,提供媒体人编辑端,以进行技术文章的编写,并通过大数据存储,大数据统计分析和一系列推荐算法构建推荐支撑系统,根据用户的喜好和访问类型生成使用画像,为每个用户提供定制化的,精准的文章,减少了用户筛选文章和新闻的时间,充分利用碎片化时间增长知识,提高自己在职场中的竞争力。
数据驱动的新闻推送平台不仅仅可以获取知识,它还是一个互联网从业者的聚集地,一个生活化的社区。
除了提供时事技术新闻的推送,用户可以对个人文章表达态度,撰稿人可以根据点赞,踩,阅读量等信息,了解文章受众的喜好,编写更迎合受众的文章;平台还包括了吐槽圈子,交友,问答等频道,其中交友频道实现了即时通讯,允许趣味相投的两名用户使用网络实时的进行收发文字消息;互联网从业者的工作时长相对于其他行业更加饱和,除开工作外,留给个人生活的时间就比较拮据,很难和线下的朋友吐露心声,吐槽圈子是一个可匿名的分区,在这里的其他用户是互联网从业人最好的倾听者;在工作过程中总会遇到一些技术难题,身边的人可能无法给你帮助,问答区可以进行无偿或有偿提问,让全国各地的技术大牛为你解惑。
总的来说,数据驱动的新闻推送平台致力于打造一个有温度,有态度的互联网人社区。
二﹑课题涉及技术平台基础的时事新闻主要来源于各大新闻网站,通过Java的爬虫框架WebMagic获取到海量的数据之后进行处理,并使用分布式文件存储的数据库MongoDB代替Mysql来进行海量数据的存储;新闻智能推送的重要支柱推荐系统采用的技术是Spark配套的机器学习库Spark Mllib。
用户平台,社区管理员平台的编写采用的是前后端分离模式,前端采用Vue.js配合常用组件库如element-UI来构建,后端采用Spring Boot搭配Spring Cloud的微服务架构,提供优质的用户体验。
1.Spark MllibMLlib 是 Spark 的机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模。
MLlib 由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道 API。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。