【摘 要】
:
证件文本信息检测属于文本图像检测的研究范围,目前针对该领域的研究已有颇多成果。传统图像处理的方法虽然算法结构较为简单,并且运行速度快,但是在很多情况下泛化能力较差,复杂场景下检测准确度较低;而对于深度学习算法来说,由于复杂的网络结构,巨大的参数运算,导致其对系统硬件设备的性能依赖较高。FPGA设备具有体积较小、能耗比高等特点,在并行计算以及深度学习领域引起越来越多的关注。但是传统方法开发FPGA加
论文部分内容阅读
证件文本信息检测属于文本图像检测的研究范围,目前针对该领域的研究已有颇多成果。传统图像处理的方法虽然算法结构较为简单,并且运行速度快,但是在很多情况下泛化能力较差,复杂场景下检测准确度较低;而对于深度学习算法来说,由于复杂的网络结构,巨大的参数运算,导致其对系统硬件设备的性能依赖较高。FPGA设备具有体积较小、能耗比高等特点,在并行计算以及深度学习领域引起越来越多的关注。但是传统方法开发FPGA加速程序门槛较高,过程复杂,周期较长,无法快速适应场景和需求的变更。OpenCL是由苹果公司最先主导开发的一款通用并行计算框架,使用高级编程语言能够方便快速地实现并行算法加速系统。同时因其具有跨平台多设备的特性,使得在OpenCL规范框架中开发的并行加速系统能够快速移植到不同硬件设备中,实现软件系统的高度兼容性,并且根据不同需求场景选择OpenCL支持的不同硬件实现系统快速部署。本文设计实现了一种基于FPGA平台符合OpenCL编程规范的图像文本信息检测系统。该系统采用了CTPN文本检测网络作为核心算法模型,在系统设计过程中深入研究了CPTN网络的算法结构,以及OpenCL并行加速原理。在OpenCL并行编程框架下针对网络结构中使用到的算法进行并行化设计,提出了一种基于归并思想的简单、高效、快速的并行矢量累加算法,有效提升了算法中数据累加过程的运算效率;同时提出了适用于CTPN网络的并行VGG16卷积神经网络、并行Bi LSTM双向循环神经网络以及并行RPN区域生成网络算法。相对于串行算法来说并行算法能够显著提升运算速度,经过不同规模的数据进行测试及性能分析,单次三维卷积运算的性能提升高达142倍,Bi LSTM网络中并行运算性能提升10倍以上,同时将并行算法整合实现了系统整体运行速度提升88.6倍。对于系统的检测效果本文采用了身份证件类、车票类、银行卡类、毕业证书类以及营业执照类等五种不同类别的文本证件图像对其进行测试,验证了系统在不同场景下文本检测的效果以及泛化能力。
其他文献
随着改革的不断深入,各行各业都进入改革攻坚期。无论企业规模大小,在改革的大环境下都承担着各自的任务和使命。为适应新时代发展,企业必须不断根据内外部环境调整经营战略,合理规划企业的战略发展方向。对企业而言,人力资源是最重要、最活跃且唯一有创造力的资源,是企业在制定发展战略时必须考虑的首要因素。与国有企业相比,民营企业、中小企业管理相对灵活,但员工绩效考核制度不成熟、不完善,机制不健全的现象比较普遍。
2015年,两会提出“双创”理念后,“双创”的浪潮在中国大地上如火如荼,黑龙江省开展了两轮科技型企业三年行动计划,哈尔滨市承担全省大约三分之二的各项指标任务,随之,哈尔滨
光学成像技术是光学领域一个非常具有前景的方向,该技术已广泛应用于医疗诊断,遥感遥测,虚拟现实等场景中。随着生物医学成像,尤其是医用内窥镜的发展,面向高分辨率,低成本的超精细内窥镜成像成为了研究热点。多模光纤因其芯径小,内部传输模式丰富,信息吞吐量大,被认为是解决超精细内窥镜成像的理想传像媒介。由于多模光纤自身特殊的光学特性,导致原始图像经多模光纤传输后会形成高度随机化的散斑图案。如何由散斑图案恢复
房地产作为最受关注的行业之一,也是促进我国经济发展的重要因素之一,自2016年起,房地产企业正式迎来“营改增”时代。在房地产企业的产业链上涉及多个方面的业务,因此在交税时难免会出现重复或者遗漏税款的情况,而这次的改革主要目的是为了使税收方面的链条拼接起来,尤其针对抵扣项目上的缺失,使得整个增值税链条更加透明和完整,链与链之间紧密却又分明。同时盈利能力又是体现房地产企业综合能力水平的要素之一,通过“
煤炭生物转化是一种清洁的煤炭利用技术,具有反应条件温和,能耗低,环境友好的优点。从研究至今的四十多年里,煤炭生物转化技术得到了蓬勃的发展,但是却仍然存在一些问题,其中最为关键的是煤炭生物转化效率低。本文尝试利用基因工程技术对真菌进行改造以提高转化效率,为煤炭生物转化的工程应用提供技术参考。主要研究结果如下:(1)研究对象为实验室保存的一株煤炭降解真菌AH,ITS基因鉴定该菌为哈茨木霉菌(Trich
近年来,深度神经网络在计算机视觉以及自然语言处理等任务上不断刷新已有最好性能,成为最受关注的研究方向。然而深度模型的参数量巨大,存储成本和计算成本过高等原因却严重限制了其在嵌入式设备和移动设备上的部署和应用。本文从模型压缩的角度出发,将深度神经网络的裁剪和优化任务分为两部分:1)针对单个卷积层的模型裁剪技术;2)探究模型各层压缩组合的最优效果以及自动化。在此研究的基础上,本文设计并实现了一个具有普
随着汽车工业的快速发展,越来越多的人开始关注通过降低结构重量来实现节约材料、减少能源消耗。减轻车身重量,一方面可节约原材料的使用,另一方面,可减少燃油消耗、降低汽车
随着GIS空间数据采集技术的发展,地理空间数据迅速增长,体量愈加庞大。在进行路径分析、地形分析等空间分析服务时,面对的不再是小规模的数据集,而是大规模的数据集,导致在线空间分析服务效率低下,难以在短时间内响应用户请求。近年来,计算机科学发展迅猛,其中分布式计算技术的出现,为上述问题的解决带来了契机。本文基于实验室地图服务项目需求,为项目中的在线路径分析服务与地形分析服务提供预处理技术,帮助提升在线
公司的正常运行是维护社会稳定的基本要素,同样也是保证国家发展的重要前提.但是公司的日常运营并不是稳定不变的,时常会因为自身内部的管理问题、决策失误或者受外部宏观因素的影响导致公司运行不稳定或出现亏损,更有甚者会因此使公司陷入财务困境的危机中,这就使得研究公司财务困境问题变得尤为重要.近些年,伴随着机器学习领域的兴起,使用机器学习模型对公司财务困境问题进行相关研究具有重要的现实意义,本文基于宏观因素
水体富营养化已成为当今世界广泛存在的水环境问题。杂食性鱼类分布广、食性杂,对水生态系统影响深远,其入侵可能会加重水体富营养化。为了解杂食性鱼类对水生态系统光、温分布及其水质的影响,本文以鲫(Carassius auratus)为对象,于室外构建了以沉水植物苦草(Vallisneria denseserrulata)为主要初级生产者的中型水生态系统,设置鲫组、无鱼对照组以及遮光处理组,通过测定水体中