基于卷积神经网络的自然场景文字检测研究与应用

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:senjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种重要的视觉数据信息的提取方式,自然场景文字检测是计算机视觉领域的重要研究课题,它在许多领域具有很大的应用价值。本文以卷积神经网络为基础,对自然场景文字检测算法进行研究,并将其应用到舰船舷号的检测任务中。本文的主要工作及创新点包括以下几个方面:首先,对于卷积神经网络的理论基础进行详细介绍。针对以卷积神经网络为主体的深度学习算法的实现技术,包括卷积核设计、池化的作用、激活函数的选取和训练过程等问题进行详细讨论。然后,在当前最有效的目标检测方法——区域候选网络的基础上,设计并实现了一种基于整体网络和区域候选网络的融合算法,整体纵向区域候选网络(Holistic Vertical Proposal Network,HVRPN)。区域候选网络的核心是运用不同尺寸的锚点框来产生候选区域去拟合目标区域,同时进行分类和回归,从而检测不同尺寸的目标。为了进一步解决不同尺寸锚点的难题,HVRPN方法将候选区域修改为垂直候选区域的集合来突破感受野的限制,从而满足不同尺寸文本的检测要求。同时,基于一种多层融合方法——整体嵌套网络(Holistically-nested networks,HED),将底层特征和高层特征结合,提高不同尺寸文字检测的准确性。论文方法在ICDAR03和ICDAR11数据集中表现出良好的效果。最后,将自然场景文字检测算法应用到舰船舷号检测任务中。针对舷号检测的特殊性对模型进行了优化,并借助迁移学习方法解决了所构建舰船舷号数据集数据量不足的问题,进一步针对舰船舷号数据的不同特征,分类进行讨论和改进,提高算法准确率。
其他文献
当我们了解历史的种种细节之后,也许就不会像某些媒体对于“迪斯尼落沪”给中国人或者上海人带来多少自信,情绪高涨、血脉贲张。    我们曾经谈到了一个中产阶级的生活样本“杜拉拉”。当我们谈到上海时,恐怕还要以它为开端。  在上海总部,男主角王伟和女主角杜拉拉开始约会。有一回,在高级餐厅吃过晚饭,他们坐着奥迪路过百乐门。  拉拉惊叫:“百乐门!”  王伟顺着她的手指往车窗外一望,他奇怪:“是百乐门呀,怎
通过对H学院大学生的调查了解,探究构建四级朋辈心理辅导体系的必要性,如何构建四级朋辈心理辅导体系,如何选拔具有专长的朋辈心理辅导员进行专业培训,如何通过朋辈心理辅导
科学编制权责发生制政府综合财务报告是近年和未来较长时期政府会计制度改革的重要内容。文章根据近年来驻马店市市本级试编权责发生制政府综合财务报告工作情况,探讨分析编
[《职工带薪年休假条例》及修改后的《全国年节及纪念日放假办法》经国务院通过并于2007年12月16日对外公布。这标志着我国通过渐进式的制度变迁模式推出了新的休假制度。有专家表示,就消费者个人来说,节假日调整可能带来休闲方式和消费方式的新变化。]    从1999年起在我国实行的一年“三个黄金周、一个小长假(元旦)”将从2008年1月1日起转变为“两个黄金周,五个小长假”。节假日调整方案——长假“缩
无线电波在通信网络,广播,目标探测,导航等领域有广泛的应用,而无线电波的接收与发射,依靠天线来完成。单一天线的方向性是有限的,而实际所需的天线工作情况,往往需要该天线有高增益、高方向性及低副瓣的特征,有时还需改变天线的波束指向进行扫描,此时,需要用到天线阵列来完成单天线无法达到的性能指标。本文以天线阵列为研究背景开展了对其波束形成及内校准中的相关问题的研究,本文详细介绍了阵列波束形成优化方法、阵列
近年来,由于私家车保有量增加,路况越来越复杂,因而由车辆变道造成的交通事故也日趋频繁。而多普勒毫米波雷达由于有较高的分辨率,能够适应各种天气状况,体积小巧,擅长检测运动目标,能有效避免因驾驶员一时疏忽而造成的不必要事故,从而受到广泛关注。虽然国内有很多厂家已经开发出毫米波雷达,24GHz毫米波雷达在国内已比较成熟,但也存在着诸多问题。比如国内大多数厂家的毫米波雷达产品使用国外芯片,可维修性弱,雷达