基于深度学习的民国纸币特定文字的检测与识别

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:holy1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纸币研究是货币史、经济史研究的重要组成部分。民国时期仅发行过纸币的地方银行就约有134家,纸币从某个角度体现了当时社会政治经济的现状。民国纸币上的信息包括发行机构,冠字号码、年号、签字和面额等。利用计算机自动高效的提取民国纸币中的文字信息,对馆藏纸币数字化储藏系统的开发有着重要的意义。由于民国纸币文字信息位置不固定、出于防伪设计的文复杂构图、艺术字体以及大量弯曲文本等因素,增加了民国纸币检测识别的难度。本文基于深度学习技术,解决受种类繁杂、复杂背景干扰引起的民国纸币文字定位不准、文字识别难度大等问题,以实现纸币图像上的文字识别为研究主线,开展基于民国纸币场景下的文字检测算法和识别算法的研究。主要研究工作如下:(1)针对纸币种类繁杂,出于防伪设计的复杂构图导致的文字检测不准的问题,提出了一种结合残差注意力机制的改进YOLO V5模型,以实现纸币的面额、发行机构和冠字号码区域的精准定位。对主流检测和识别模型框架进行分析实验,确立了以检测模型框架YOLO V5,识别模型框架CRNN为主体的研究思路。在YOLO V5的残差结构C3中结合注意力机制技术,形成基于残差结构的注意力机制模块,提高了模型提取图像特征的性能;引入了基于内容感知重组的上采样算法CARAFE,使得模型在上采样过程中获得更大的感受野;采用2D空间维度的激活函数FRe LU,使得模型在拟合中能够结合空间上下文关系,弱化了民国纸币文字区域的视觉干扰问题。通过在民国纸币数据集上进行实验,结果显示纸币文字检测准确率高达99.3%。与YOLO V5和YOLO V7相比,本方法在检测精度上均有着优异的表现。(2)利用识别模型框架CRNN,结合自建民国纸币文字库,经特征提取、序列预测和序列翻译输出识别结果,提升了民国纸币文字识别的准确率。通过实验结果表明,民国纸币识别模型准确率达到了99.94%,平均每张图片的识别耗时仅346.26毫秒。平均编辑距离达到了0.9998。对比Paddle深度学习框中的PPOCR“ch_ppocr_mobile_v2.0”识别率高了32.84%,对比“ch_PP-OCRv3_rec”识别率高了24.94%,对比“ch_PP-OCRv2_rec”识别率高了34.94%。显著提升了检测识别的准确率,证明了该模型在实际应用中的有效价值。(3)针对民国纸币中艺术字体和弯曲文本等导致的文字识别不准的问题,建立了民国纸币文字库。为了降低识别模型的误检率,文字库也采用与纸币相一致的繁体字的形式。按照单字、长短句和词组三种形式制作了共13122张数据集,包括5357张单字中文、4412张长短句中英文文本和3353张词组;在字库中添加了民国纸币文字库字典,限制了识别模型预测范围,避免输出民国纸币文字库之外的字符。
其他文献
在近年的城市建设中,城市更新、住区更新等关键词已成为热点词汇。在住区更新中,关注儿童成长过程中对空间权益的需求,对儿童的身心健康发展至关重要。本文通过对儿童友好城市、儿童户外活动和儿童友好住区更新等进行综述,了解国内外对于儿童友好型住区公共空间更新的研究背景和发展现况。近年来我国学者开始关注儿童友好城市和儿童友好社区建设,但对于住区儿童友好化的建设大多停留在游戏场地的设计上,缺乏系统性地植入“儿童
学位
全等三角形是初中数学的重要学习内容,一方面开启了学生对于平面几何知识学习的大门,一方面为九年级学习相似三角形做了铺垫。因此,对其进行深入的探讨具有十分重要的意义。而将数学史融入三角形全等的判定教学能够有效激发学生的学习热情与创造兴趣,使其数学思想得到潜移默化的影响,为培养核心素养打下良好的基础。基于上述研究背景,本研究提出了四个研究问题:(1)发生教学法为基础的HPM教育思想,融合途径和教学实践方
学位
在元宇宙的背景下,本文以VR场景下的产品互交设计为基础,将VR环境下的目标群体互动经验应用在产品设计师的产品互交设计作为一个起点,将VR技术的沉浸度与互发性等特点作为一个切入点,总结AR场景对产品互交设计程序的作用,并对提升产品互交设计效率的重要作用进行总结,为设计师探索产品互交设计程序提供了一套流程清晰、成本低廉的新方法和新思路。本文以此为依据,以产品互交设计过程和方法为基础,将VR技术相融合,
学位
随着时代的发展、城市功能的更新,越来越多的城市工业遗址面临着被拆除的危机,与此同时,中国城市的面貌出现了同质化倾向。我们该如何让城市展现独一无二的城市风貌?对城市工业遗址的再利用是其中一条可行的途径。讲故事是人们认识事物的一种最原初的方法。通过叙事,我们对于事物的记忆会更加系统和完整。将叙事引入景观设计,即是将我们生活的城市看做一个巨大的故事系统,整合当下城市居民生存的自然环境背景、历史文化背景以
学位
随着城市化的不断推进,国家对于生态文明建设的重视,口袋公园普遍地出现在我们的日常生活中,城市朝着更加现代化的步伐前进。自古以来,中国是农业大国,农业是我们国家兴旺发达不可缺少一部分,农作物是情感的寄托,居民在自己阳台、院落周边种植农作物,以此作为健康的食物和庭院景观。但是,在高楼林立、用地紧张的城市中,每家每户的居民种植农作物受限于客观条件没有形成有规划的城市农业景观,除此之外,由于居民在居民楼旁
学位
历史文化街区作为城市文化内在的“生活性”与“历史性”的外化体现,是城市文化向外输出的名片之一。随着中国经济的腾飞,历史街区更新进程加快,在“自上而下”方式推进的过程中,逐渐暴露出空间同质化严重、地域性特征模糊、遗产性建筑破坏、活力性丧失等问题。本文针对这些问题,尝试利用社交媒体大数据收集城市街道使用者的评价与需求,开展设计研究。大数据作为一种新兴的技术手段和工具,其多样的量化工具与大量的城市数据为
学位
在“记得住乡愁”的大趋势下,在快速的城镇化进程中,乡愁型景观的营建成为理论与实践的热点。随着城镇化进程的进一步加快,“离乡”将成为常态,“乡愁”将变为常情,从而使乡愁型景观变为城市环境营造中的“刚需”。本研究以皖北乡土化景观及皖北地域文化特色为根基,以蒙城乡韵公园的设计为实践路径,对乡愁与城市公园的乡土化景观设计进行探讨研究,试图解决人们在城市化进程中对思乡怡情精神场所的缺失的建设痼疾,以期通过本
学位
根据第七次人口普查数据显示,我国老龄化程度进一步加深。在此背景下,如何养老已经成为我国社会发展的重要问题。随着老年人口的不断膨胀,养老需求的不断提升,产生了养老环境压力、养老需求难以满足等诸多问题。建设老龄友好环境是我国应对人口老龄化问题采取的重要举措,构建老龄友好环境评价体系是指导老龄友好环境建设的必然要求。本研究着眼于老龄化背景下上海既有住区室外环境的提升问题,采用马斯洛需求层次理论结合实证研
学位
高校承载着人才培养、科学研究和社会服务的功能,大学生众创空间作为大学知识溢出和创新研究集中迸发的场所,是集合“产、学、研”一体化发展的综合性平台。在经过一定时间的高速发展后,大学生众创空间的建设发展存在着功能单一、空间运行不畅、创新服务不健全等问题。经过多年共存,老城区高校与其周边区域相互影响,高度融合。众创空间作为高校重要的空间类型,是创新创业知识充分发散的场地。本文尝试运用SECI理论对大学生
学位
以深圳市塘朗山为研究对象,首先通过对塘朗山的地形中坡度,坡向,海拔,垂直弯曲方向等要素的收集,运用视域通视性分析的方法,通过分析它们的变化对视域范围的影响,得到地形变化与视域范围变化的相关性程度大小和其相互作用规律,为观景平台选点提供视域参考。其次,运用视线通视性分析的方法,通过对点与点间可见性的研究,构成由视域面精准到视线点的视域网结构,通过连接与改善点,线,面的相互关系,将视觉呈现的复杂性转化
学位