基于Hapdoop平台的聚类数据挖掘技术研究文献综述

 2023-03-08 14:15:30

云计算Hadoop平台的搭建和研究【摘要】:Hadoop是一个免费的开源云平台,是允许在集群计算机上分布式处理大数据的软件框架。

它是一种可靠、高效、可伸缩的云平台,很适合在实验室环境下进行模拟测试。

该系统想要实现前,最主要的一步是Hadoop平台的搭建,而想要搭建平台,则需要了解平台的构成体系,下面就针对这一方面进行了详细地介绍。

【关键词】:研究背景 Hadoop 分布式平台HDFS体系结构MapReduce引擎 K-means算法研究背景: 云计算是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变。

云计算(Cloud Computing)是分布式计算、并行计算、效用计算、 网络存储(、虚拟化、负载均衡、热备份冗余等传统计算机和网络技术发展融合的产物。

随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。

《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。

大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。