基于深度学习的字符图像识别和图像检索研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:morningwind2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征的提取和表示一直是图像识别和检索领域的一个关键环节,优秀的特征提取和表示算法,不仅能为后续识别和分类算法带来方便,更能提升整个视觉系统的性能。然而,采用传统方法的图像识别和检索算法,其原理是根据图像的底层像素视觉特征做出判断,这样的判断方式与“人”通过理解图像内容对图像进行识别与分类有本质差异。因此,基于此类方法的图像识别与图像检索系统存在着识别率有待提高,耗费人力,特征不易迁移等缺点。目前已有的深度学习方法虽然相较于传统的图像特征提取与表示方法,展现出了更好的效果,但随着工业界在图像识别和检索领域对提升精度、缩短时间耗损方面的需求不断提高,采用深度学习方法的图像识别及检索方法后续仍需进行更深入的探索、研究。针对以上问题和情况,本文主要的研究内容和工作包括以下三个方面:(1)结合现有深度学习模型的数理分析,归纳出深度学习的方法在理论模型的特点。结合研究背景,本文在数据预处理设计、深度神经网络构架搭建、核模型设计上总结了一些优化的经验。(2)提出了基于扩展非线性核残差网络的字符图像识别算法。该算法是一种深度学习方法,其创新点包括三个方面:1)提出了一种新的深度学习核结构,使得特征表达更准确;2)设计了一种半监督的字符图像预处理方法,使后续训练更具针对性;3)引入了dropout技术,缩短了训练时间的同时保证训练不陷入过拟合。上述算法,我们在不同的字符图像识别库MNIST、SVHN进行了实验,证明了有效性。(3)提出了基于扩展非线性核残差网络和哈希的图像检索算法。该算法将本文提出的扩展非线性核结构,作为图像检索系统中的“高层语义提取器”,并结合了具有快速搜索优势的哈希算法,实现了图像的快速准确检索功能。我们在CIFAR-10数据库上进行了实验,证明了该算法的有效性。
其他文献
为了能够准确实时检测出电力系统中存在的电能质量扰动,提出了一种自适应确定隐神经元数及修改权值的自适应walsh基函数神经网络时频分析方法。在此基础上采用加滑动窗的方法,
舞蹈是艺术的灵魂,正因为是灵魂,少儿就更应该去触摸它、研究它、喜欢它,舞蹈是美育的重要内容之一,随着人们对物质文化需求的不断提高以及对精神文明建设重要性认识的加深,
手机媒体日渐成为元媒体,催化了不同年龄层的人成为“低头族”。通过对安徽理工大学在校大学生的调研,分析当前大学生成为“低头族”的原因和消极影响,研究矫正“低头大学生
目的观察早期有序康复护理应用于膝关节损伤关节镜手术患者的临床效果。方法选择2017年8月至2018年8月于我院接受关节镜手术的60例膝关节损伤患者,随机分为两组各30例。对照
每年5月,正是黄栀子开花的季节.广西昭平县昭平镇塘山村几个山头的黄栀子基地连成白绿相间的一片,空气中弥漫着沁人的芬芳.
氨化后的秸秆是营养丰富的生物饲料,可以提高秸秆的综合利用率,降低养羊成本,增加养殖效益。简单说来,可用16字概括:"氨源用足、密封完全、水分适宜、时间充分"。秸秆要求:干净、
东津大坝一期混凝土面板施工质量控制江西东津水电站筹建处都进平1施工质量控制体系概述在东津水电站一期混凝土面板施工中,施工监理站相当于工程的质量监督体系,对施工质量监督