基于深度学习的场景文字检测与识别研究文献综述

 2021-10-23 20:17:31

毕业论文课题相关文献综述

一、选题背景文字,作为人类交流思想、传承文化的媒介,超越了时间和空间的限制,从古至今发挥着重要的作用。

文字区别于变幻莫测的图像和视频,有着更强的逻辑性和更概括的表达力。

这种属性使文字在自然图像和视频中呈现出一种特殊的、重要的信息来源。

利用文字中所蕴含的高层语义,可以更有效地利用场景信息。

场景文字检测技术在图像搜索、目标定位、人机交互、无人驾驶、车牌识别、工业自动化等领域都有着广泛应用。

因此,自然场景中的文字提取技术,成为了近几年计算机视觉领域的热门研究课题。

然而,传统光学字符识别技术主要面向高质量的文档图像,要求输入图像背景干净、字体简单且文字排布整齐规则,在这种情况下OCR(optical character recognition)技术能够达到很高的识别水平。

与文档文字识别不同,在自然场景图像中,准确定位和识别文字都是极具挑战的任务。

复杂的背景、多变的文字布局、低分辨率、不均匀照明、多语言、多方向等问题,都加大了自然场景图像文字检测的难度。

为了应对这些挑战,学术界和工业界开展了大量的研究和实践工作,提出了一系列针对场景文字检测问题的模型与方法。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。