毕业论文课题相关文献综述
文 献 综 述(一)选题背景近几年,弹幕式的网站越来越火热、中国电影行业的发展同时产生了大量的影视评论,这样也产生了大量的热点内容。
今年也产生了大量的热点,如新冠状病毒、科幻大作火热的背后和文化输出等等。
每一个公众热点的背后都有大量的创作者发表自己的观点,而这些创作者不断产生的作品又会激发观众产生更多的观点,而这些观点的来源就有来自于时下最流行的网络信息形式如弹幕等形式,挖掘这些热点,可以同时产生经济价值和社会效应。
本课题的研究专门针对网络视频等网站的热点进行爬取并进行数据挖掘,首先通过爬虫框架WebMaigc对选定的网络视频平台进行数据采集,然后将这些采集的数据进行处理,利用文本挖掘及数据挖掘对这些数据进行筛选及工具自带的算法分析,最后将结果呈现给用户。
(二)研究意义挖掘不同类型话题的热点也就把握了当前社会的主要矛盾和发展脉络。
对于个人而言如视频内容工作者,掌握热点能够提升自己的作品价值,获取更多的价值回报;对于企业而言,掌握热点能够帮助企业适时调整生产、投资战略以适应市场需求,如某品牌之间联动产品的包装等;对于政府而言,掌握热点有助于政府检测社会舆论,适时引导舆论处于对政府有益的局面。
(三)国内外研究现状本课题主要涉及的研究领域包括数据挖掘理论、数据挖掘技术的应用和网络爬虫系统的主要构成等方面。
童昱强在其论文中基于数据挖掘理论主要包括DBSCAN聚类等算法进行新闻文本聚类算法和热点话题抽取算法的设计,并将算法实现到新闻热点发现系统中。
杨永红在其论文中对于网络热点的研究使用了数据挖掘技术方法,将数据挖掘中的关联分析、聚类和分类等手段应用到热点的采集中,通过技术手段等网络实时热点进行高效率的掌控。
罗兵在其论文中提出了分布式爬虫系统新的主要构成,该系统通过构建网页代码解释器执行JavaScript脚本代码,通过发送异步Ajax请求后将返回数据进行加载,实现动态网页的抓取,符合现在流行平台页面的内容获取。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。