基于机器学习与数据挖掘分析用户特征及其真实性——以新浪微博为例文献综述

 2022-08-19 14:03:42

一、文献综述

  1. 国内外研究现状
    1. 微博平台

微博是我国最早兴起的自媒体平台之一,以其理念为人人都是自媒体得到网友的广泛认可。到目前为止新浪微博已经成为各大官方组织机构和明星艺人发布新闻消息的第一聚集阵地。像政府(人民日报、共青团中央等)通过发微博向人们通报社会事件的进展和结果,公众人物也能在该平台上实现与观众、粉丝的零距离交流。对于普通网友而言,转发、评论、点赞成为表达情感和观点的重要途径。最重要的是,微博不同于其他社交平台,譬如QQ空间、微信朋友圈,在这里不需要对方关注或添加就能看到其相关信息和动态。

目前微博共有3个站点,分别是https://weibo.cn、https://m.weibo.com、https://weibo.com。依次如图1-3。

三个站点的复杂程度不同,在数据搜索功能上以“高级搜索”最为突出。

图1

图2

图3

微博每天产生过亿条微博文本数据,是具有丰富价值的大数据资源。因此设计并实现一套自动化微博数据挖掘系统,通过对海量微博数据进行分析,描绘用户画像,提取热度话题,深度获得隐藏在数据背后的深刻意义是当下信息时代人们迫切需要的问题。

微博平台的用户以超过数亿,每个人每个账号都是组成庞大数据的来源。用户行为是传播信息、产生数据的主力。活跃用户会浏览各种信息,使用微博提供的各种功能,比如关注、收藏、回复和上传图文频等行为,这些行为会生成大量的内容数据。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。