基于卷积神经网络的扭曲文本检测方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:chenyanchendan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的普及,生活中的方方面面都应用着计算机视觉技术。场景文本检测是计算机视觉领域的基础任务,通常与文本提取、文本识别等技术相结合,应用在智慧城市、智能辅助驾驶、视障人士导盲等领域中。当前,对文档图形进行检测主要使用的是通用检测器,但复杂的背景环境以及场景文本行的扭曲等条件会导致大量漏检、误检问题的出现。为克服场景文本扭曲等复杂现实问题以提升文本检测效率与质量,本文结合通用检测模型和卷积神经网络理论,开展了场景扭曲文本检测方法的研究。论文的主要工作如下:(1)对近几年场景文本检测模型的网络结构和实现方法进行研究,采用CNN提取特征的高效率性,且提取的特征能较好的表示语义信息的特点。在场景文本检测模型中应用卷积神经网络,提取出的场景文本特征拥有较好的语义信息,并将其应用到场景扭曲文本检测中。(2)对于场景中文本行扭曲、环境复杂导致检测质量不高的问题,本文参考现阶段的深度学习模型,并在此基础上对网络模型进行修改,提出一种基于PSE网络结构的场景扭曲文本的检测算法。将主干网络替换成轻量级网络从而提高模型检测速度和检测质量,在处理相邻文本行重叠像素值冲突的问题时,用K-nearest取代队列机制加快训练速度。(3)为解决常规方法检测场景文本时效率和质量之间不平衡性这一问题,在PA网络上进行改进,得到一种级联的场景文本检测方法。首先,使用轻量级网络Mobilenet V2初步提取场景文本特征。然后,构建一个充分利用上下文语义信息的可级联网络,对Mobilenet V2初步提取特征的基础上再次增强特征信息。最后,利用便于分类的高层网络特征和便于定位的低层网络特征以改进的方法进行融合,使级联网络提取的特征鲁棒性更强,更便于场景扭曲文本区域的定位和分类。通过在公开数据集CTW1500、ICDAR2015上进行实验验证,本文的方法在场景扭曲文本检测的性能上均有提升。基于改进PSE网络结构的场景扭曲文本检测算法不仅有较好的准确率,在场景文本行的形状为扭曲时,也取得了不错的检测质量。基于PA网络的方法,在保住原有准确率的基础上降低了网络模型参数量,从而实现检测速度提高,实现实时检测。
其他文献
In the real-world applications,many problems,such as engineering,finance,and transportation and so on,can be modeled as the stochastic linear complementarity problems.In this paper,some numerical algo
学位
水下无线光通信以其低损耗窗口、抗干扰能力强、通信速率高的优势在水下无线通信领域占据极其重要的地位。然而光束在海洋信道传输过程中主要受到海洋湍流、吸收和散射的随机多变影响,带来的能量损耗和信道衰落,将导致水下光信号传输系统的误码率增加,传输性能严重降低。因此探索合适的水下光信号传输方式,研究水下无线光通信系统中的信道编码和调制技术是非常有必要的。在此背景下,本文提出一种将LDPC编码与PPM调制联合
太阳能是自然界的基本能源之一,可以为社会的可持续发展提供取之不尽的清洁能源。大规模利用太阳能电池(将太阳能直接转换为电能的装置)是解决全球能源危机和应对全球气候变暖等问题的有效途径。钙钛矿铁电氧化物材料在光伏器件有着良好的应用前景,铁电体中的自发极化特性能够促进载流子的分离并使光电压高于光学带隙,对光电转换效率的提高有巨大作用。但是,钙钛矿铁电氧化物由于氧和过渡金属原子两者之间的电负性差异和较大的
近年来,随着制造业的转型和成熟,医药业、食品业、物流业及计算机,电信和家用电器等3C产业等行业变得活跃起来,许多行业的生产已从变化不大的大批量产品转移到了高混合量的小批量产品,这就需要构建一个灵活而高效的制造系统。传统的工业机器人需要单独的工作空间且价格高昂,无法满足时代的需求。既可以独立工作又能与人类协作的机器人——协作机器人已经成为时代的需要。鉴于协作机器人工作场所及工作内容,对其稳定性、安全
覆盖于圆柱细丝壁面的液体薄膜流动是自然界中普遍存在的物理现象。纤维细丝流体覆膜流动的动力学特性将会对涂覆工艺的质量产生巨大影响。在涂覆的过程中,纤维细丝上液体的流动特性是决定镀膜质量的重要因素,通过了解纤维细丝上覆膜的流动特性,可实现精确调控覆膜的形貌和结构。因此,开展圆柱细丝上覆膜流动的动力学特性研究,探索控制界面稳定性和动力学行为新方法,具有重要的科学意义和工程应用价值。本文针对圆柱细丝上高粘
本论文将放电等离子体烧结技术与球磨法相结合制备了具有好的放氢性能和抗氧化能力的Al-Bi-CNTs、Al-BiOX(X=F、Cl、Br、I)和Al-Bi2O2CO3三种制氢材料。分别测试了它们的产氢性能,并通过XRD、SEM-EDS、TEM-SAED、XPS和理论计算等手段对它们的产氢机理进行了研究。首先,采用球磨加放电等离子体烧结法制备了Al-Bi-CNTs材料。发现经SPS烧结后的Al-Bi-
随着经济社会的不断发展,整个社会的产业结构也在不断升级,工业社会最显著的特征就是生产场所转向室内,因此现今对室内环境的要求越来越严格,在要求室内环境卫生的同时还要求室内环境有很高的人体舒适度。空气的温度和湿度是影响室内环境舒适度的两大主要因素,在中国南部地区每年3、4月份时的回南天和7、8月份时的梅雨季,环境湿度都会陡增,人体在这种环境下体感舒适度会降低;同时过高的湿度非常容易滋生各种有害微生物,
针对6R关节型机器人在上/下料过程中存在生产效率较低、偶然发生机械碰撞以及运行过程伴随振动的问题以及基本鲸鱼优化算法存在的收敛精度低、易陷入局部最优解等不足,本课题提出一种改进的鲸鱼优化算法,并基于改进的算法对6-DOF串联型工业机器人进行运动分析及轨迹规划的研究。本文主要对课题中鲸鱼优化算法改进部分的关键技术进行了研究,并对工业机器人进行了时间最优轨迹规划。首先,基于标准D-H法对研究本体建立关
数字时间转换器(DTC)是一种根据数字信号控制实现不同的输入到输出延时的电路,可用于调整关键信号路径的传播延时。利用DTC可以相对地提高时间分辨率,在最近几十年,DTC越来越受到学术界和工业研究的关注,其主要应用在频率合成和有线/无线发射机和接收机等领域。DTC与传统的数模转换器(DAC)相似,重要的性能特性包括动态范围、分辨率、精度、非线性和单调性,也包括功耗和抖动或相位噪声。本论文主要研究一种
Na0.5Bi0.5TiO3(NBT)基无铅陶瓷由于其自发极化铁电特性,在铁电储能、铁电催化、铁电光电等交叉领域持续受到研究人员的关注,有望在换能器、传感器、存储器和光电器件等领域得到应用。NBT陶瓷的氧八面体结构将电荷、自旋、极化强烈的耦合在一起,产生丰富的电学、光学、磁学、储能物理等特性,通过掺杂NBT陶瓷从而调控其微观结构及性能是一种有效途径。本研究通过设计B位Mo,Nb,Ta掺杂,采用传统