文 献 综 述
摘要: 图像间相似性研究是一个有广阔应用价值并富有挑战性的课题,不仅涉及到图像处理的基本内容,还和人工智能、模式识别以及计算机视觉有紧密联系。当前图像相似性比对处理的速度过慢,为了适应需求,使用Spark并行化处理,提高算法效率。通过毕业设计,提高学生的程序设计和实现能力,加强分析问题解决问题的能力。
关键词:图像相似性,加速算法,Spark
1、相关概念
1.1 图像相似性
图像相似度计算主要用于对于两幅图像之间内容的相似程度进行打分,根据分数的高低来判断图像内容的相近程度。可以用于计算机视觉中的检测跟踪中目标位置的获取,根据已有模板在图像中找到一个与之最接近的区域。已有的一些算法比如BlobTracking,Meanshift,Camshift,粒子滤波等等也都是需要这方面的理论去支撑。
还有一方面就是基于图像内容的图像检索,也就是通常说的以图检图。比如给出一幅图像,在海量的图像数据库中罗列出与之最匹配的一些图像。当然这项技术可能也会这样做,将图像抽象为几个特征值,比如Trace变换,图像哈希或者Sift特征向量等等,来根据数据库中存得这些特征匹配再返回相应的图像来提高效率。
1.2 Spark
Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的map reduce的算法。
- 国内外研究情况
受到Google两篇经典论文(GFS和MapReduce)的启发,Hadoop项目诞生于2005年。起初,Hadoop只是用来支撑Nutch搜索引擎项目。2006年后Hadoop脱离了Nutch,且变为Apache的顶级项目,并在2008年打破TeraSort的世界纪录。从此Hadoop变为大数据处理的事实标准,在工业界和学术界得到蓬勃发展。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。