基于网络爬虫面向餐厅点评的美食推荐系统文献综述-文献综述网

文献综述

现今互联网的快速发展，大数据时代应运而生，数据资源的增长速度以几何数量级呈现，个性化推荐技术的出现解决了庞大的用户群体对数据的需求问题，更是广泛应用于电影推荐、就业推荐、商品推荐、新闻推荐等系统中。基于网络爬虫面向餐厅点评的美食推荐系统，是通过网络爬虫获取既定美食点评网站的信息，再将得到的数据进行清洗入库，然后根据建立好的用户模型，选取合适的推荐算法计算出相似度得到topN用户感兴趣的餐厅及菜品。[1][2][3][4]

一、网络爬虫相关概述

1.网络爬虫技术简介[5][6][7]

网络爬虫又被称为网页蜘蛛，网络机器人，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。网络爬虫是一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成部件。网络爬虫的价值在于使互联网中的信息更方便地为人所用，自动提供更全面、更精确的信息，提升用户体验。在使用网络爬虫时，应该遵循robots协议合法爬取数据。

2.主题网络爬虫[8]

主题网络爬虫（Topical Crawler），又称聚焦网络爬虫（Focused Crawler），是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。和通用网络爬虫相比，聚焦爬虫只需要爬行与主题相关的页面，极大地节省了硬件和网络资源，保存的页面也由于数量少而更新快，还可以很好地满足一些特定人群对特定领域信息的需求。

3.网络爬取框架scrapy[9]

Scrapy是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

以上是毕业论文文献综述，课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。

注册

找回密码

基于网络爬虫面向餐厅点评的美食推荐系统文献综述

您可能感兴趣的文章

登录

您可能感兴趣的文章