基于注意力机制的多光谱虹膜识别关键算法研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:shiyiliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会发展,特别是新冠肺炎疫情,非接触式的生物模式识别的研究和应用被愈发重视,而虹膜识别早已被公认为是最安全和最有前景的生物识别方式之一。目前的虹膜识别技术仅能对近红外虹膜图像识别,现实生活中采集的巨量可见光虹膜图像无法被使用,交叉光谱虹膜图像特征融合和匹配是目前迫切需要解决的问题之一。同时,繁杂的虹膜识别流程将会花费巨大的计算资源,进而放大流程中产生的误差,简化识别流程并增加识别算法的鲁棒性是目前需要解决的另一个问题。因此,本文工作和贡献如下:首先,本文提出了一种局部端到端密集深度卷积神经网络(DDNet)用于虹膜识别。DDNet采用了更深层次的网络结构,并将分割后的图像作为输入图像,无需进行预处理或其他传统的图像处理技术。在两个公开可用的CASIA-V3-Interval和IITD数据集上重新标注了带有睫毛区域并生成对应的掩模,进行消融实验分析了睫毛的影响以及提出的网络结构的有效性。实验结果表明,DDNet在不同参数下具有适应性和鲁棒性,并且在大多数现有算法上均具有出色的性能。其次,在DDNet的基础上,本文进一步提出了一个基于注意力机制的无分割的网络(NSNet),通过赋予网络通道注意力和特征重用加强网络的鲁棒性和准确性,在保持先进的网络性能的同时,NSNet仅使用了31个卷积层完成无分割虹膜识别框架的虹膜特征提取和识别任务。本文提出了一个完全端到端的无分割虹膜识别框架,不进行虹膜分割和归一化处理,将原始图像直接进行特征提取和识别,且获得了优于其他方法的性能。在实验中,本文使用了统一的参数设置,在公开可用的四个数据集上,所提出的方法始终优于最先进的几种方法,同时进行一系列消融实验进行验证和讨论,实验结果表明,提出的框架具有更高的准确性、泛化性和鲁棒性。最后,本文提出一种稠密的激励挤压网络(DSENet)用于特征提取,使用实值特征模板进行跨光谱虹膜匹配。DSENet是基于注意力机制的深度卷积神经网络,一方面使用BN-Relu-Conv1×1结构增加网络的非线性结构,通过稠密连接反复利用特征,有效防止过拟合,另一方面使用提出的DSE结构,学习各个特征通道之间的联系并赋予注意力值,提取出更准确更稳定的特征。再使用全局平均池化结合全连接层和softmax的结构得到紧凑并且归一化的实值特征模板,有效减少虹膜模板大小。同时,本文提出一种基于DSENet的端到端跨域虹膜识别框架,将跨域匹配问题转换为多对一的分类的问题。使用公开可用的一个跨传感器虹膜数据集和一个跨光谱虹膜数据集进行实验,这些实验结果表明,所提出的基于DSENet的实值特征匹配方法优于现有的跨域虹膜匹配方法,而提出的端到端的DSENet具有更优秀的匹配精度,且具有较强的鲁棒性。
其他文献
机会网络是一种由大量低成本、短距离无线通信设备构成的自组织网络,通过“存储-携带-转发”的机会通信方式完成消息的传递,具有拓扑时变、网络自组织等特性,在应急通信、智慧交通、环境监测等领域有很大的应用价值。链路预测是机会网络研究中的热点和难点之一,其主要通过已知的机会网络结构等信息预测未来节点之间存在连接的可能性,进而帮助我们理解机会网络的拓扑演化规律,为机会路由协议的设计提供支撑。本文介绍了现有的
学位
自区块链问世以来,它的去中心化等特点引起了诸多研究人员的关注。越来越多的研究学者纷纷涉足这一领域,但是想要对它进行更加深入的研究,就需要从底层开始,剖析区块链的底层架构。截止目前,区块链的改进逐渐成为一个热门的研究方向,但目前国内外相关研究还没有显著的成果。区块链技术最显著的特点为去中心化,它的目的是为了让网络上的节点在不使用中心服务器的基础上相互信任。越来越多的应用采取了这项技术,也因此衍生出不
学位
目标检测是计算机视觉的基础性研究领域之一,它主要由分类与定位两个任务组成,用于检测输入图像或视频中是否存在感兴趣的目标。目标检测在视频监控、医疗诊断及自动驾驶等领域都有着非常重要的应用价值,因此受到了大量研究人员的关注。近几年随着深度学习的快速发展,深度学习研究方法也逐步与传统的检测算法融合,取得了巨大的突破。然而在实际应用中,目标通常会受到光照、拍摄视角和遮挡等因素的干扰,导致目标的形态和外观发
学位
异构蜂窝网络指的是在原有宏蜂窝小区中引入多种小蜂窝接入技术,例如设备间通信(Device-to-Device,D2D)和中继通信(Relay)等,用来满足更多的通信业务需求,其已经成为未来蜂窝移动通信的发展趋势。其中,D2D通信允许距离较近的用户设备之间直接建立通信链路,其数据传输不需要通过基站进行中转。因此,D2D通信可以提高频谱资源的利用率、降低基站的负载和用户的能耗等。其次,在基站和用户设备
学位
铁路是国民经济大动脉、关键基础设施和重大民生工程。《中长期铁路网规划》中提出构筑“八纵八横”高速铁路主通道,为构建现代综合交通运输体系、促进经济社会持续健康发展、实现“两个一百年”奋斗目标提供有力支撑。当国家铁路工程穿越世界遗产地缓冲区,《保护世界文化和自然遗产公约》及《实施世界遗产公约操作指南》明确要求世界遗产的保护和管理应维持或增强其突出普遍价值,为遗产采取所需的适当的法律、科学、技术、行政和
学位
身份信息滥用是社会顽疾问题。文中提出了一种基于区块链的身份鉴证与授权(Blockchain-based Identity Authentication and Authorization, BIAA)机制,该机制要求用户主体在对业务进行身份授权时提供有效身份证件和生物特征信息,确保业务为本人授权;同时将业务信息及身份授权写入区块链账本,进一步实现业务的安全存证与可追溯。为构建该机制,提出了“身份注
期刊
目标跟踪是计算机视觉领域最重要和最具挑战的基本任务之一,其目的是给定第一帧中目标信息,在后续帧中估计该目标的位置和尺度,目标跟踪任务可以被分解为分类和回归任务。分类任务通常通过对目标的外观进行建模,使用外观模型定位视频帧中的目标。回归任务有多尺度搜索、边界框回归方法。本文针对目标的外观建模和尺度估计两项基本问题进行研究,以提高分类的准确性和尺度估计的精确性,并将之嵌入到基于深度学习的判别式跟踪框架
学位
掌纹是重要的生物特征模态之一,由于其蕴含丰富的纹理特征,并具有良好的隐私性和安全性,近年来成为研究和应用的热点。当前主流的掌纹识别算法包括基于编码和基于深度学习两大类。基于编码的识别算法无需训练,存储开销和匹配计算量低,可应用于低复杂度的实际场景,但容易遭受各类干扰影响。基于深度学习的算法对各类干扰(如错位、形变等)具有更强的鲁棒性,但通常需要大量的训练样本,训练的计算复杂度和硬件要求较高。本文深
学位
随着社会进步以及互联网络的发展和在线平台的广泛应用,不仅打破了传统课堂学习的时空约束,还提供了丰富的学习资源。通过在线教学系统中的学习数据,定义学生的编程技术水平,再结合学生的知识水平和相关数据来为学生推荐合适的题目是一个至关重要的任务。本文基于学生所做过的题目习题数据,通过分析题目数据特征和题目的相关编程知识结构,使用神经网络对所有数据特征进行学习,从而达到获得学生知识认知状态的目的;对于相似题
学位
随着现代社会的发展,人们对社会公共安全问题越来越重视。行人重识别作为计算机视觉领域的热门方向之一,其能够在不同场景并且数据特征差异较大的情况下,快速甄别同一身份的行人,因此该技术在智能监控系统、边境管制等安防领域有着重要应用。目前,行人重识别这一技术在有数据标注的监督学习领域取得了较大的进步,在识别准确率上有较高的成绩。但是,在无标注的数据上进行无监督训练的效果还不尽人意,主要问题在于不同摄像机视
学位