基于深度学习的扑克牌特征提取文献综述

 2022-05-26 21:33:27

  1. 研究背景及意义

1)背景:全球的科技巨头纷纷拥抱深度学习,自动驾驶、AI医疗、语音识别、图像识别、智能翻译以及震惊世界的AlphaGo,背后都是深度学习在发挥神奇的作用。深度学习是人工智能从概念到繁荣得以实现的主流技术。经过深度学习训练的计算机,不再被动按照指令运转,而是像自然进化的生命那样,开始自主地从经验中学习。

深度学习(deep learning)也被译为深层学习,是美国学者Ference Marton和Roger Saljo基于学生阅读的实验,针对孤立记忆和非批判性接受知识的浅层学习(surface learning),于1976年首次提出的关于学习层次的一个概念。2006年,加拿大多伦多大学教授、机器学习领域泰斗——Geoffrey Hinton和他的学生Ruslan Salakhutdinov在顶尖学术刊物《科学》上发表了一篇文章,开启了深度学习在学术界和工业界的浪潮。Hinton提出了深层网络训练中梯度消失问题的解决方案:无监督预训练对权值进行初始化 有监督训练微调。其主要思想是先通过自学习的方法学习到训练数据的结构(自动编码器),然后在该结构上进行有监督训练微调。2011年,ReLU激活函数被提出,该激活函数能够有效的抑制梯度消失问题。2011年,微软首次将DL应用在语音识别上,取得了重大突破。2012年,Hinton课题组为了证明深度学习的潜力,首次参加ImageNet图像识别比赛,其通过构建的CNN网络AlexNet一举夺得冠军,且碾压第二名(SVM方法)的分类性能。也正是由于该比赛,CNN吸引到了众多研究者的注意。

自2006年以来,深度学习在学术界持续升温。斯坦福大学、纽约大学、加拿大蒙特利尔大学等成为研究深度学习的重镇。

国内对深度学习的系统研究起步较晚。 2005年,上海师范大学黎加厚教授在《促进学生深度学习》一文中率先介绍了国外关于深度学习的研究成果,一般以此作为我国深度学习研究的起点。文中介绍了深度学习的概念,提出深度学习是指在理解的基础上,学习者能够批判地学习新思想和事实,并将它们融入原有的认知结构中,能够在众多思想间进行联系,并能够将已有思维知识迁移到新的情境中,做出决策和解决问题的学习。

2)意义:扑克牌识别本身是识别技术中的基础内容,但是其影射出了图片识别技术这些年的巨大变化,具有很好的学习价值。

本次研究的课题名称为基于深度学习的扑克牌特征提取,课题的主要目的是设计并实现一个功能完整,操作简单的特征提取系统,使其能够对静态的扑克牌图像进行特征提取和匹配,从而实现对扑克牌的分类识别。

本次研究以扑克牌的特征提取为例子,简单实践了基于深度学习的扑克牌特征提取系统的实现。扑克牌一共有四种花型,分为:红桃,黑桃,方片和梅花。每种花型只有十三张牌,标志内容清晰,明确。

该研究是基于深度学习框架的。考虑到,PyTorch是相当简洁且高效快速的框架,设计追求最少的封装,设计符合人类思维,可以让用户尽可能地专注于实现自己的想法,入门简单,考虑采用。

  1. 国内外研究概况

1)国外:在国外深度学习领域,较为出名和基础的是基于MNIST数据集进行的手写数字识别系统的搭建,其对本研究具有极大的学习价值。MNIST数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology (NIST)。训练集 (training set) 由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局 (the Census Bureau) 的工作人员。测试集(test set) 也是同样比例的手写数字数据。原始的MNIST 数据集中包含了 60000 张训练图片和10000 张测试图片。本次研究,将模仿MNIST数据集构建扑克牌识别数据集,图片来源为www.google.com、www.baidu.com。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。