文献综述
自新冠状病毒爆发以来,大量学者通过获得微博数据对疫情防控提出了科学有效的分析预测,对基于微博数据的新冠肺炎疫情舆情演化的时空分析有助于更好的抗击疫情。通过统计分析不同时间段内新浪微博博文与公众群众的大量评论,利用分布式爬虫技术、分布式数据库系统、SnowNLP情感分析模型以及K-Means文本聚类算法,对与新冠肺炎疫情相关的的话题进行了舆论分析,可视化的展现了本次疫情事件中网络舆情的时空演化过程。此外,在时间维度方面,通过文本聚类与情感分析,发现了公众群众对于此次新冠病毒的态度大致经历了三个阶段;在空间维度方面,通过地理统计分析,发现了此次疫情最严重地区的网民评论人数最多,情感值也相对较低。[1][3][4][7]
在此类研究中,通过从微博上爬取与新冠肺炎相关的新闻及评论,经数据预处理,得到新闻语料集和评论语料集,利用CRF模型围绕捐资、防控、临床、英雄等四类主题抽取疫情事件及其组成元素。然后,在引入情感词典和修饰词词典的基础上,对情感强度进行计算,利用BiLSTM模型得到网民的情绪分布。最后,基于自注意力机制的BiLSTM模型得到疫情事件对网民情绪的影响程度。他们尝试着为各级政府等机构科学准确的掌握疫情舆论情况,并为其高效的做好防控宣传和舆情引导提供了强有力的理论支撑。[2]
当前,国内外对公众关注度的分析主要分为基于供给(Supply-based)和基于需求(Demand-based)两类。基于供给主要是指网民主动发布在微博、Facebook、博客等社交媒体上的数据,基于需求则是人们在网络中的搜索行为数据。[5]
针对新冠疫情这一重大突发公共卫生事件进行舆情分析,有利于重点区域的疫情防控及感染人员的增减预测。基于此构建出的舆情分析方法框架,将数据获取、指标评定、信息抽取、时空分析、可视化表达等环节进行分解,引入自然语言处理技术与社团网络发现算法解析复杂文本语料和挖掘不同区域指标信息,可为重大公共事件的舆情分析与评价提供借鉴和参考依据。[6][8][9]
从国内外学者对于相关实验的研究可以发现,利用大数据监测系统来分析研究公众关注度已成为当前国内外研究趋势。[10][11][12]
总结:
在对于文本语料的选取方面,本类实验仅将微博评论作为对象,评论者多为活跃于社交媒体的青年群体,未能覆盖全年龄段的网络用户。此外,Snow NLP的情感分析对公众倾向性明确的评价能够准确识别,但对于倾向性相对模糊或偏向中立公众情感则较难获取正确评分。在这类实验研究中国内外学者不仅通过多种研究统计分析方法从不同的维度(空间、时间等)对此次疫情情况进行了数据分析,还从行政、法律角度对网络谣言传播治理提出了针对性建议。因为不同类型突发事件的谣言内容与传播特征各不相同,尤其是突发公共卫生事件专业性较强,其谣言传播具有更强的“隐蔽性”与“专业性”,应针对不同类型的突发事件谣言进行区别分析与探讨,方能提出符合事件发展规律的谣言治理方案。
[1]陈兴蜀,常天祐,王海舟,赵志龙,张杰.基于微博数据的“新冠肺炎疫情”舆情演化时空分析[J].四川大学学报(自然科学版),2020,57(02):409-416.
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。