基于深度学习的场景文字排列方向识别方法研究文献综述

 2021-12-18 20:36:49

全文总字数:3100字

文献综述

一、研究背景文字是人类思想的直接载体,蕴含着丰富的语义信息,因此在人工智能的相关研究中,其地位非同一般。

而在自然场景目标的检测中,场景文本的检测就是极其重要的一环,它经常出现在标识牌、商品 标签、产品包装、许可证之上。

近些年,随着电子商务的飞速发展,一大批针对商品分类、搜索以及推荐的软件产品应运而生。

这些产品往往都需要高效且准确地获取商品的相关信息,通过文字检测技术,可以替代产品信息的人工录入,这可以使这些厂商的人力成本大幅度降低,也极大的提高了效率。

但是在场景文字扫描的过程中,图像采集可以通过扫描设备,也可以是手机、相机等设备,在这种情况下,人为的拍摄难以保证图像采集是完全无倾斜的状态,无法保证文字一定是水平的,图像中的文字将不可避免地在水平的基础上有一定程度的旋转角度,这对后期处理和使用都会产生不利的影响。

因此可以预见,自然场景文字方向检测是我们需要重点关注的,因为对自然场景文字方向检测技术的研究不仅可以促进本领域的发展,同时对其他领域的发展也有重要且积极的作用。

二、国内外研究现状当前,针对图像文字方向检测,学者们已经有了很多深入的研究:对于直线检测的方法,通常分为两步来实现:特征点提取和直线拟合。

主要分为利用图像空间的文字行的位置特征来实现,通过文字行的边缘特性来实现,或者文字行在频域空间的特性来实现检测。

文字行位置一般是先找出单个文字的区域,然后再对文字的中心点或下边缘点进行拟合。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。