基于网络爬虫的电商比价及推荐系统的设计与实现文献综述

 2022-05-30 22:14:45

研究背景及意义

1.课题背景

自从互联网诞生,就开始潜移默化地改变着人们的生活工作习惯,它虽然并没有很久的发展历史,但他的地位已经是无可比拟的。互联网的蔓延是迅速的,在人口大国——中国,则更为明显。据此前CNNIC发布的第43次《中国互联网络发展状况统计报告》显示。截至2018年12月,我国网民规模为8.29亿,互联网普及率达59.6%。报告还显示,2018 年,中国网民人均周上网时长为 27.6 小时,网络购物用户规模达6.10亿(手机网络购物用户规模达5.92亿),网络支付用户规模达6.00亿(手机网络支付用户规模达5.83亿),这是一个多么庞大的网络群体?[1]由互联网孕育出的电子商务在人们的生活中已然不可或缺,时时刻刻扮演着重要的角色。

这是一个快速变化的时代,这是一个信息膨胀速度最快的时代[2]。随着互联网和电子商务的不断发展,商品数量正呈指数级别的增长,商品规模的扩大以及普遍的渗透,一方面在很大程度上满足了用户们各种各样的需求,另一方面也造成了数据过载,增加了用户从海量数据中定位有效商品的成本,给用户带来巨大的冲击[3]。用户需要花费大量时间进行品类判断,浏览对自己没有用处的商品信息。对于一个效率的时代来说,必然会导致大量用户的流失。为了提高用户的工作效率,减少无用信息的使用时间,急需一个有效的工具[4]

网络信息的急剧膨胀,使得如何从网上获取信息并且合理有效利用这些信息成为当前炙手可热的研究课题。因此针对不同行业、不同领域的搜索引擎如雨后春笋一般涌现出来。搜索引擎功能的强大确实给我们带来不小的震撼,虽然用户可以使用搜索引擎来实现商品的定位,但是现在这样信息膨胀的时代,很容易出现有价值的信息或数据被淹没的情况,而且通过关键词搜索往往会导致出现大量商品干扰自己的选择,一群“新娘”中如何才能找到那个真正想要的“秋香”呢?我们不难看出搜索引擎目前还有一些不尽如人意的地方:

  1. 通过搜索引擎往往以追求网络覆盖率为目标,追求大而全为己任,致使有限的搜索能力不能满足无限的网页内容;
  2. Internet上网页内容时刻在不断更新,通用搜索引擎总是定期去抓取信息,有时反馈的信息或数据是错误的或者过时的;
  3. 通用搜索引只是记录了过去某个时间点的数据,是一个历史数据,并不能反映一个历史过程;
  4. 其通用性,致使不同领域、不同背景的用户往往需要经过初步过滤才能得到所需的查询结果;
  5. 通用搜索引擎通常只给一个输入框,仅仅提供基于关键字的查询,难以支持基于语义和主题查询[5]

由上所述,在如此庞大的电子商务交易市场中,用户如何从海量的商品中快速的选到自己心仪的商品,网站如何将商品推荐给有潜在需求的用户,尤其是今天商家面对的是前所未有的专业化的消费者,因此信息不对等的现象必须大幅度减少[6],利用个性化推荐算法,为用户推荐更为精确的商品,来满足用户们的个性化的需求,显得尤为重要。商品个性化推荐系统通过分析用户的搜索记录以及购物订单记录,实现对用户兴趣和习惯的建模,从而能从海量的商品中为用户找到真正的需求。减少用户的购物成本,并有效解决严重的信息过载问题,减少网站的压力,降低数据对用户的冲击力。

2.研究目的和意义

任何东西在发展的过程中,人们总会发现他的缺陷和弊端,从一开始的摸着石头过河到现在的遍地开花,愈发成熟,电商平台可以说汇集了众多的智慧,造福了很大一批人,虽然大家对他褒贬不一,但是他一定是推进人类发展的一股强大力量。

由于我国数量庞大的消费者群体和强大的消费能力,涌现出不少企业走向这个风口。这些电商平台的商品种类繁多,入驻的商家也是络绎不绝,这就会存在大量商家出售相同商品的情况。在如此庞大复杂的互联网电商平台中,用户若只是自己去搜索进行对比,必定要花费大量的时间和精力,还很难买到最实惠的商品,这就和网购的初衷背道而驰。雷军曾提出“在风口上,猪都能飞起来”的观点,如果说刚接触电商的时候是第一个风口,那接下来的外卖、打车、单车等就是紧接着的风口。既然如此,为何不把这里电商的一个小空缺当做我们的一个风口和切入点呢?这样的背景下,比价系统就应运而生,其主要目的就在于方便消费者迅速找到最实惠、最满意的商品,同时给用户推荐符合用户购买喜好的商品。同时,为优秀的商家形成竞争优势。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。