基于网络爬虫面向餐厅点评的美食推荐系统文献综述

 2022-03-14 20:15:37

文献综述

现今互联网的快速发展,大数据时代应运而生,数据资源的增长速度以几何数量级呈现,个性化推荐技术的出现解决了庞大的用户群体对数据的需求问题,更是广泛应用于电影推荐、就业推荐、商品推荐、新闻推荐等系统中。基于网络爬虫面向餐厅点评的美食推荐系统,是通过网络爬虫获取既定美食点评网站的信息,再将得到的数据进行清洗入库,然后根据建立好的用户模型,选取合适的推荐算法计算出相似度得到topN用户感兴趣的餐厅及菜品。[1][2][3][4]

一、网络爬虫相关概述

1.网络爬虫技术简介[5][6][7]

网络爬虫又被称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成部件。网络爬虫的价值在于使互联网中的信息更方便地为人所用,自动提供更全面、更精确的信息,提升用户体验。在使用网络爬虫时,应该遵循robots协议合法爬取数据。

2.主题网络爬虫[8]

主题网络爬虫(Topical Crawler),又称聚焦网络爬虫(Focused Crawler),是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。 和通用网络爬虫相比,聚焦爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快,还可以很好地满足一些特定人群对特定领域信息的需求。

3.网络爬取框架scrapy[9]

Scrapy是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。