基于爬虫和文本情感分析的影评打分系统研制文献综述

 2022-01-08 20:18:49

全文总字数:3487字

文献综述

1.基于爬虫和文本情感分析的影评打分系统研制课题背景与意义电影现今已成为人们的主要娱乐消遣方式之一,中国电影业今年来也获得了长足发展。

《你好,李焕英》上映二十余天获得49亿票房足以看过中国电影业的迅猛发展。

中国电影行业要想获得进一步的突破,就需要挖掘观影者的影评数据,并对其进行分析获得更加精准的针对性的改进。

现如今我们可以很方便的获取可视化的电影票房排行,观影人群的年龄分布等数据,但是受自然语言研究的限制,人们对于影评资源的利用仍然是十分贫乏的,如何利用好影评资源对电影业的发展做出更大的贡献,以及在此基础上对于机器学习和文本数据的挖掘做出进一步的研究,并且将人文社会学科和人工智能学科进行跨学科的交流发展是本次课题思考和研究的问题。

2.基于爬虫和文本情感分析的影评打分系统研制课题的国内外研究现状的介绍以及应用2.1各方法的原理网络爬虫:网络爬虫的历史可以追溯到上世纪的九十年代,网络爬虫一直是学术研究的热点,其出现对于数据挖掘和机器学习的发展具有举足轻重的意义。

爬虫在广泛运用的同时,也需要注意遵循Robots协议,此协议明确标注了可以被爬取和不能爬取的资源,在使用过程中要格外注意。

网络爬虫技术包括三个关键部分,分别为获取资源,解析资源和爬行。

发展至今,已经有很多的开源的爬虫框架,在我们学习和使用的过程中可以使用这些开源的框架进行,省时省力。

常见的开源爬虫列表如下图所示,本课题采用python实现,所以使用Scrapy框架来进行爬取。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。