文献综述
Michael Jordan在21 世纪的计算大会上做 “大数据的分治和统计推断” 的主题演讲中提到:“科学的发展带给我们庞大的数据可以被用于经典理论的检验和实验科学中。我们经常谈的粒子科学研究、物理学研究、基因学研究、都给我们带来了大量的数据。对人类行为的测量,特别是互联网行为的测量能够被用于个性化发展和开辟新的市场。还有我们所说的传感器的网络,这就是大数据的现象。”
当今时代,一方面人们在主动地获取数据。各个科学领域都在大量地获取数据。另一方面人们在被动地囤积数据。随着计算机互联网、搜索引擎、电子商务、多种传感器和多媒体技术的发展和广泛使用,各种形式的数据如江河流水般地涌来。而采取什么方法从承载着信息的数据中提取有效信息尤为重要。
大数据时代的来临,传统的统计思想方法是否应该被摒弃是当前一个热门且有意义的课题([1]-[17])。《连线》主编Chris Anderson[10]在题为“理论的终结:数据洪流让科学方法依然过时”的文章中,率先提出:“在PB时代,有相关性足够了”。舍恩伯格教授[4]的《大数据时代》核心观点之一就是:“趾高气扬的因果关系光芒不再,卑微的相关关系将被lsquo;翻身做主rsquo;,知道lsquo;是什么rsquo;就够了,没必要知道lsquo;为什么rsquo;”。但在《大数据时代》的中文版序言里翻译者周涛[4]说:“放弃对因果关系的追求,是人类的堕落”。对于这种现象,李国杰院士[11]认为:“在大数据中,看起来毫不相关的两件事同时或相继出现的现象比比皆是,相关性本身并没有多大价值,关键是找对了lsquo;相关性rsquo;背后的理由,才是新知识或新发现。”近几年,越来越多的学者认为:大数据要以科学的统计思想为指导,不能脱离统计思想方法。而对于习惯于结构化数据研究的统计学思想方法来说,大数据分析显然是一种崭新的挑战,挑战来自于大数据的复杂性、不确定性和涌现性,其中复杂性最为根本,统计思想方法也要顺应大数据时代的要求而进行改变。
受上述文献的启发,本课题拟用大数据技术找到影响标准普尔500指数的相关性数据为例,论述统计思想方法在大数据分析中的必要存在性,大数据要以科学的统计思想为指导,不能脱离统计思想方法。
课题研究的意义和价值
大数据时代的来临,传统的统计思想方法是否应该被摒弃是当前一个热门且有意义的课题,所得理论研究成果不仅对于生产生活的实际具有指导意义,而且研究过程本身中所产生的一些方法、思想对于统计思想方法的发展的进步有一定的推动和促进的作用。
利用统计分析软件做出由大数据技术得到的影响标准普尔500指数的相关性数据的模型,利用统计思想方法判断模型真假,论证统计思想方法在大数据分析中的必要存在性。
参考文献:
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。