基于鱼眼镜头图像识别的回转库档案实时定位技术研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:jiaojiao2008zwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纸质档案的高密度存储基本上都采用回转库存取方式。盘点档案是否在库以及档案存放位置是否正确是日常管理的一项繁琐而又重要的工作。传统的手工盘库方式劳动强度大且易出错。本论文利用当前较为成熟的图像识别技术对档案盒的数字标签图像识别定位技术进行了研究,在降低档案管理成本、提高盘库定位识别精度方面具有非常重要的意义,研究成果的市场应用前景良好。由于回转型档案柜内部空间狭小,且多采用嵌入式系统作为数据采集及控制核心。本论文提出了一种基于鱼眼镜头数字图像标签的采集及识别技术的档案盒实时盘库解决方案。该方案在实现数字标签识别定位时,鱼眼镜头畸变造成的图像模糊与深度学习时间开销大是需要解决的两个难点。论文首先利用鱼眼镜头进行数字图像标签的采集,通过棋盘格标定的方式在较少时间内完成了图像的畸变矫正。由于矫正后图像出现了明暗分布不匀,边缘区字迹模糊等现象,论文研究设计了最优的图像二值化解决方案得到了较为清晰的二值化数字标签图像。在利用轮廓跟踪算法对数字标签图像进行标签分割和单数字字符分割后,论文运用了Le Net-5网络对单字符图像进行了识别。为提高单字符图像识别运算速度,论文对Le Net-5网络进行了改进减少了运算参变量;为克服字迹模糊使得二值化后笔画残缺造成正确率下降现象,论文对训练数据集进行了残缺字符的增强处理,提高了识别正确率。除此之外,论文还研究了采用YOLOv3-tiny网络的目标检测算法直接对矫正之后鱼眼镜头灰度图像完成数字标签识别。最后,先分割后单字符识别和YOLOv3-tiny的直接目标检测识别构成了对数字图像标签的双重互补识别,进一步提高了数字图像标签的正确率。论文主要工作及创新点如下:(1)研究了自适应二值化处理中窗口尺度及本底噪声阈值的最优取值方法,解决了矫正后鱼眼镜头图像的明暗分布不匀,边缘区字迹模糊等现象带来的图像质量下降等问题。(2)对原始的Le Net-5网络的卷积核进行改进,由原先单层5*5卷积核变为两层3*3卷积核,减少了模型的参数量,提升了算法实时性。(3)针对字迹模糊造成二值化笔画残缺引起的正确率下降现象,论文进行了数字字符随机裁剪,增强训练数据集,使模型对部分像素丢失的数字字符的识别具有更好的泛化能力。(4)优化原始YOLOv3-tiny网络结构,降低网络的下采样率,提升了模型对小目标(档案数字字符标签)的检测正确率。
其他文献
互联网的高速发展,以及“互联网+教育”等新型教育方式的形成,不仅影响着信息传播和接收的速度与方式,也改变了当代图书馆用户对信息公开的实时需求。除此之外,图书馆信息公开不仅能保障用户的知情权,还可以对图书馆业务进行透明化监管。高校图书馆信息公开改革在此背景下应运而生,而改革应该基于用户对其服务各方面的满意度和影响因素。因此,本文以调研国内外高校图书馆信息公开的相关文献为理论研究,选择河南省高校图书馆
目的:观察健脾调肝方治疗肝胃不和型功能性消化不良的临床疗效和复发情况。方法:选取2018年9月至2019年9月期间就诊于石家庄市中医院脾胃科门诊符合纳入标准的肝胃不和型功能性消化不良患者70例。利用随机数字表的方法,将患者分为治疗组和对照组,每组各35例。治疗组给予健脾调肝方口服,对照组给予奥美拉唑肠溶片口服。两组治疗疗程均为4周。分别于治疗前后记录两组患者的中医证候积分、功能性消化不良生存质量量
高维目标优化问题广泛存在于科学研究和工程实践中,有着重要的研究价值及应用前景。随着目标维度的增加,传统的多目标优化算法的性能会急剧下降。基于分解的多目标进化算法MO
随着计算机科学技术的快速发展和人类安全意识的不断提高,数字水印技术逐渐被应用到多媒体信息安全领域中。图像的数字水印技术主要是把水印信息嵌入到图像中去,隐藏的信息不容易被发觉,且不会影响原图像的应用价值,对于防伪溯源和版权保护起到了很好的作用。目前,人们已经提出了很多数字水印的算法,经过证实,这些算法在很多领域都得到了应用。近些年,半色调化技术已经变得很成熟,将半色调技术与数字水印结合已经成为新的研
非线性科学作为一门交叉学科,已经逐渐发展成为科学研究的一个重要领域。许多非线性系统伴随有混沌现象,且系统的非线性程度越高意味着其动力学行为越丰富,因此混沌理论与应
石膏是一种重要的工业原料,同时也在一些工业过程中以副产物的形式生成。我国的工业副产石膏产量日益增加,其堆存会造成一定的环境问题。大部分工业副产石膏主要为二水石膏(DH
本文主要研究了光诱导N-芳基丙炔酰胺环加成反应合成卤代氮杂螺[4,5]三烯酮的方法。第一部分研究了光诱导条件下高价碘试剂PhI(OCOCF3)2作用的N-芳基丙炔酰胺合成卤代氮杂螺[4,
光本身携带动量,当光照射在物体表面时,动量会传递给物体,并由此对物体产生力的作用,即光辐射压力。基于此原理,布兰津斯基(Braginsky)等人于1967年提出了由光腔和力学振子通
问答社区(Community Question Answering,CQA)是当下较为流行的一种知识获取以及分享的用户互动平台。CQA提供了很多服务来提升用户获取知识的效率,其中之一就是问题响应时间
随着我国交通运输的快速发展,隧道的建设也是最重要的部分之一,而对于隧道的保养十分重要。隧道衬砌裂缝的检测关系到交通运输的安全,我国目前检测隧道衬砌裂缝采用的是人工巡检的办法,其工作量大,并且无法满足快速有效的要求。随着人工智能机器视觉的发展,将神经网络和深度学习结合,在图像识别领域得到了广泛的应用。本文深入研究了深度学习的相关理论和目前流行的目标检测算法,在卷积神经网络的RCNN(Region-C