基于卷积神经网络的指部双模态识别方法研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:sandro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多模态识别技术通过融合多种特征信息进行身份认证,具有高防伪性和稳定性等优点。指静脉和指节纹特征获取方便、特征稳定、不易伪造,成为多模态识别技术重要的研究对象,但是指部多模态研究仍存在一些问题值得研究。手指姿势的偏移、光照、采集光谱波长易引起类内差异高和类间差异低,导致特征提取困难,而且多模态融合过程中增加了特征维数和计算复杂度。如何有效地提取图像特征信息,并且实现特征融合,成为多模态特征识别该领域中关键问题。卷积神经网络(Convolutional neural Network,CNN)能够自主抽象出图像的高层语义信息,在多模态生物特征识别领域获得广泛关注。因此,本文以指静脉图和指节纹图像为对象,研究一种基于CNN指部双模态特征识别方法。主要内容如下:
  (1)分析了图像质量对特征提取效果的影响,针对手指静脉图像对比度低问题,引入简化NL模块用于静脉特征图全局上下文信息建模,最大程度保留静脉图像全局信息,并进一步设计NL-ResNet提取指静脉特征。针对手指关节纹图像偏移现象,采用多分辨图像输入策略,并搭建双流网络实现指节纹特征提取,此方法可以在一定程度上弥补手指节纹图像偏移问题。实验表明,两种方案能够有效地提高单模态特征识别系统性能。
  (2)为了融合模型能够兼顾手指静脉和指节纹特征之间相关性,以及增强融合特征的多样性,提出多尺度特征融合模块MSIF,用于融合网络每层模块的多尺度特征。以提高手指静脉和指节纹融合特征的判别能力,使得基于CNN多模态特征识别在指部生物特征识别上获取更好效果。
  (3)针对多特征融合后,特征信息复杂度上升造成网络拟合困难,提出注意力卷积二叉树模块。通过树状结构结合位置注意力机制和通道注意力机制,以强调重要的空间和通道信息,提高网络拟合效率。
  分别在MMCBNU_6000、SDUMLA-HIT、PolyU-FV三个指静脉数据库和PolyU-FKP指节纹数据库上进行实验,证明本文所提出的单模态特征提取方法有效性。同时,基于以上四个单模态数据库重新组合成双模态数据库,进行对比实验,说明本文提出的特征融合方法的效果优于一些常用方法。
其他文献
四旋翼无人机具有机械结构简单、能够实现垂直起降等特点,因此在民用、商用、军用领域都有广泛的应用。然而,四旋翼无人机是一个非线性、欠驱动、强耦合的系统,而且在实际飞行中易受诸多干扰因素的影响,因此很难获得四旋翼无人机的精确模型,这给四旋翼无人机的自主飞行控制带来了很大的挑战。本文针对四旋翼无人机的建模和轨迹跟踪控制两个问题展开研究,主要研究内容如下:  (1)研究了风场扰动下四旋翼无人机的建模方法。
随着现代科技的发展,机器/机器人嗅觉发挥着越来越重要的作用,具有灵敏嗅觉感知能力的机器人可以在危险气体检测任务中降低伤亡和损失。其中,气味识别能获取丰富的气味类别信息,具有抗干扰性和高预判性等优势,在气敏任务中应放在高度优先的位置。由于传统的单一型气味源定位具有一定的局限性,本文从追踪犬通过先识别气味再追踪危险品的视角出发,立足于多足移动机器人,将目标气味识别融入到泄漏源定位过程中,提出了基于气敏
在社会与经济的高速发展背景下,个人压力不断增大、睡眠疾病的患病率持续增加,睡眠监测与睡眠疾病诊断的居家观测成为睡眠研究中亟需解决的严峻问题。因此,使用提取过程简单的单通道生理信号进行睡眠相关领域的研究就有比较实际的应用价值。本文提出了一种简单有效的基于光电容积脉搏波(Photoplethysmography,PPG)的多分类自动睡眠分期与睡眠疾病诊断方法。首先,对CAP睡眠数据库中108位受试者的
学位
在科技迅速发展的今天,计算机视觉技术也得到了极大进步,特别是在机器人视觉、智能驾驶、安保等方面,而这些都离不开行人检测和追踪。行人检测顾名思义就是针对图像或者视频中的行人进行检测的一种技术,行人追踪则是对行人进行跟踪并预测轨迹的一种技术。行人检测和追踪作为计算机视觉的关键技术,却受到了很多条件的约束,特别是环境因素、遮挡问题和较小尺度行人检测等问题,这跟摄像头的拍摄角度和环境因素息息相关,针对以上
学位
随着卫星数量的不断发射和增多,遥感数据也开始海量增长,有时地物特征并不能从单一的遥感数据中获得,因此,需要对多种遥感数据进行融合。并且对遥感图像在空间分辨率与光谱分辨率需求更高,而由于传感器硬件的限制,很难获取同时具有高空间分辨率与高光谱分辨率的遥感图像。针对现有融合方法在融合过程中不能同时兼顾图像的空间与光谱信息,以及出现的光谱扭曲现象,本文提出相关的改进算法,主要工作如下:(1)针对现有大部分
学位
随着技术的发展,服务机器人已经广泛进入日常生活。机械臂作为机器人的四肢起着重要的作用,考虑到传统机械臂通常根据既定流程运动,无法感知外界信息,因而本系统将机械臂与视觉相结合,提高服务机器人的智能化程度。首先,明确系统的总体方案和硬件设计思路。阐述系统的要求,明确总体的结构,分析系统的硬件,确定各个器件的选型,并给出各部分的驱动及控制模块,设计系统的总体电气硬件图。其次,对系统的算法进行分析和研究。
随着信息化时代的迅速发展,人们对信息处理的要求越来越高,对滤波精度的要求也不断提高。但在实际应用中,系统会存在不确定性,从而降低滤波器的性能甚至导致滤波器发散。因此,针对不确定系统参数的情况,本文做了以下研究:(1)对于具有不确定系统参数的非线性系统,基于递归线性最小方差估计(RLMVE)框架,分析了系统参数对均方误差(MSE)的影响,即系统参数偏差越大(无论是正偏差或负偏差),则MSE越大。基于
直流伺服电机以其带负载能力强、运行可靠和效率高等特点广泛应用于工农业生产及日常生活中。作为现代工业的主要动力来源之一,一旦电机发生故障,则会导致机械系统瘫痪甚至威胁生命安全。《中国制造2025》指出,中国正处于实现制造业强国目标的关键时期,对航天装备、电力装备和农机装备等要实现智能化故障诊断。因此,实现直流伺服电机智能化状态监测和故障诊断具有重要意义。研究表明,机械振动信号蕴含丰富的时频特征信息,
本文基于神经网络,提出了多传感器线性和非线性融合估计方法。本文首先针对线性系统,利用局部线性估计和三种经典分布式融合估计作为样本训练集,提出了基于BP网络的按矩阵加权,按对角阵加权和按标量加权三种分布式融合算法,并给出了关于该融合框架隐含层节点数目选择的依据。其次,本文以局部线性估计值作为网络输入,集中式融合估计作为目标训练集,提出了一种基于递归网络Elman的线性系统分布式融合框架。该融合算法精
学位
随着人工智能和互联网的快速发展,网络购物、网络支付的使用逐渐普及,身份识别等信息安全问题日益严峻。由于人脸识别具有免接触、自然、便捷等优点,日渐成为生物特征识别领域的研究重点,但二维人脸识别存在容易被照片或者动图假冒的缺点,使它的使用逐渐受到限制,而三维人脸图像蕴含人脸的深度信息,能防止造假的发生,更加安全和便捷,可以有效的解决信息安全问题。在人脸识别领域,如何提高准确率和降低识别时间是学者们研究
学位