全文总字数:2440字
文献综述
文 献 综 述1.1课题的背景与意义在当今社会随着网络科技和智能技术的不断发展进步,图像出现在我们生活中的方方面面,如交通道路上红绿灯的抓拍,智能手机中的美颜相机,视频软件上的各类流行视频,以及近两年新兴的人工智能领域中的智能视觉等,这些图像中都蕴含着大量信息。
其中,文字是场景图像识别中一个重要研究方向。
文字,在人类社会中无处不在,是人与人之间信息交流与传送的一个主要方法。
文字与一般的花鸟山石等视觉元素不一样,它可以携带着大量精确的高级语义信息。
这是场景图像中信息的一个主要来源,因此如果我们能够获取场景图像中的文字就可以让我们更高效的了解图像,对许多基于视觉的应用具有着重要意义,例如基于智能视觉的人工智能路径导航等。
所以,在近几十年来,什么样的方法能够有效的检测、识别并加以利用场景图像中的文字引起了国内外许多科技研究者的兴趣,获得了他们的广泛关注,其中比较具有代表性的是国际文档分析与识别会议(International Conference on Document Analysis and Recognition,ICDAR)。
近十几年来,随着智能终端的广泛使用,人们拍照,搜索图像等正在无时不刻的生产和处理大量的场景图像,这些场景图像中经常包含许多文字信息。
这也为场景文字识别提供了巨大的应用市场和应用空间。
以深度学习为基础的人工智能技术的之所以能够不断的发展进步,要归功于深度学习中神经网络优秀的特征学习能力和特征提取能力,其中神经网络的网络结构灵活,便于训练和调整。
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。