基于深度学习的指静脉识别算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ahutxhb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物特征识别系统安全性和准确性需求的增加,指静脉识别受到广泛地研究。与其他生物特征相比,指静脉识别自带活体识别,安全性更高,使用更加便捷,因此具有重要的研究意义。随着深度学习技术的发展,指静脉识别算法的效果也在逐渐提高。特征提取是指静脉识别算法的研究重点之一,如何提取具有较好识别性的特征仍然存在挑战。为了提高特征的判别性,本文研究了一种增加特征判别性的损失函数。为了提取更多的语义信息,本文设计了具有双重语义的特征提取模型。为了进一步缩小特征的类内距离,本文研究了一种增加类内紧凑性的损失函数。具体地,本文的主要研究工作如下:(1)数据对基于深度学习的方法至关重要,而当前公开的指静脉数据集的数据量均较少。为了充分发挥深度学习的效果,本文构建了一个目前为止最大的指静脉数据集。该数据集中有6180种不同的指静脉类别,数据量是其他现有公开数据集的数倍。(2)为了提取具有判别性的特征,通常的做法是在损失函数中增加间隔,使模型的决策边界收缩,从而实现在特征之间增加间隔。这种间隔的大小由损失函数中的超参数决定,在训练过程中一直保持固定。然而,本文通过实验发现,这些基于固定间隔的方法会使部分特征出现重合,影响了特征识别的性能。因此,本文提出了一种基于动态间隔的损失函数。具体地,间隔的大小由特征的后验概率确定,当后验概率较大时,特征的间隔减小;当后验概率较小时,特征的间隔增大。与基于固定间隔的方法相比,本方法减小了间隔对特征的约束力,也减少了特征的重合,进而提高了指静脉识别的效果。实验证明了该方法在多个数据集上均优于基于固定间隔的方法。(3)为了增加特征的语义信息,传统的特征提取流程使用了有监督的信息进行模型训练,也就是说这种方法仅仅具有有监督的语义特征。受到使用自动编码器进行无监督数据降维方法的启发,本文认为该方式提取的特征同样具有丰富的语义信息,也能在指静脉识别中发挥重要作用。本文设计了一种具有双重语义的特征提取模型,该模型结合有监督与无监督特征提取方法,复用一个特征进行模型训练。与只使用有监督信息或者只使用无监督信息相比,增加了特征的语义信息。由于无监督部分使用的解码器需要从低维特征重构输入,因此去除了原始输入中的冗余信息,本文对这种方法重构的输入进行了可视化展示。实验证明使用该方法提取的特征在指静脉识别上具有更好的性能提升。(4)基于间隔的损失函数通过压缩决策边界间接的压缩了类内距离,提升类内紧凑性,从而提高了特征的判别性。但是这种方式对类内紧凑性的提高是有限的,若间隔设置过大容易使模型收敛困难,出现更多特征重合的情况。针对这个问题,本文基于中心损失函数提出了角度中心损失函数。该方法为每类特征学习了一个特征中心,该中心的方向是所有特征方向的均值,同时惩罚了特征离中心的余弦距离,也就是特征与中心的夹角。角度中心损失函数解决了中心损失函数训练测试不匹配的问题。本文通过对比实验发现角度中心损失函数具有更好的性能。此外,为了更直观地理解角度中心损失函数的作用,本文进行了一些理论分析和可视化展示。
其他文献
得益于互联网和移动设备的广泛应用,以信息流形式为基础的电子商务平台和短视频平台正在占用更多的流量和用户时长。为了解决“信息过载”问题,个性化推荐系统成为了互联网厂商重点发展的核心技术。本文以多媒体推荐系统为研究课题,主要关注大规推荐排序算法中普遍存在的挑战,重点研究了利用深度学习和多模态学习解决用户冷启动,物品冷启动,小样本量等问题。主要内容分为三部分。第一,物品冷启动。物品冷启动指的是新的物品加
自动求解数学题是机器智能推理领域的一个重要子问题,用于解决这该问题的自动求解器通常为一种特定的机器智能系统。广义的来说,在推理任务中,机器智能体需要依据给予的信息(如事实描述或观测信号)和已有的先验(如模型结构和常识知识),在特定的限制下来解决特定的问题或者给出总结。更具体地,对于自动求解数学题系统,求解器需要依据给定的问题描述和数学先验知识,生成符合规范可计算的解题等式。该任务基于检测机器智能体
随着深度学习的兴起,越来越多领域开始使用深度神经网络和循环神经网络构建性能卓越的数据驱动的模型结构。比如在自动驾驶和智能安防等场景下,深度模型的出现使得这些技术出现了较大的进展,因为基于大规模数据的深度模型在自然情况下可以对图片进行高效、高准确性的计算和判断。但是有部分研究员们却发现深度模型存在一个比较严重的隐患,即通过对图片添加一些很小的扰动便可以导致模型做出错误的判断。在高性能要求的应用场景中
文本检测与识别的相关工作在我们的日常生活中随处可见,如身份证识别、停车场的车牌识别等,极大地方便了人们的生活。不同应用场景下文本内容形态多样,尺度差异较大,语义背景也往往不同,需针对性地设计检测与识别算法以取得更好的实操效果。本文基于民国报纸标题检测与识别这一具体中文场景任务展开,该工作有利于将纸质报纸转化成能检索能查询的数字馆藏,进而挖掘其史料价值。我们对基于深度学习的文本检测与识别工作进行研究
自主装修机器人在执行各种任务时需要在装修环境中来回移动。自主路径规划能力是一个移动机器人智能化的重要衡量因素。这要求移动机器人能够主动感知环境信息,然后利用环境信息做出导航决策。在动态环境中,移动机器人对于环境全局信息的认知是不足的,其通过传感器主动感知环境局部信息来规划自己的路径。因此,对环境信息理解和利用的能力是移动机器人实现自主路径规划的关键。本文主要的工作如下:1.使用ROS和Gazebo
微博、微信等网络社交媒体的兴起标志着自媒体时代的到来,自媒体新闻有着广阔的传播覆盖面,对自媒体新闻进行情感分析有利于了解社会公众对公共事件的整体态度和看法。目前,得益于众多电商平台完备的评价体系,商品、电影评论等领域已经有很多规范的中文情感数据集。然而对于其他非特定领域,由于缺乏相应的评价体系,数据标签的获得只能依赖成本高昂的人工标注,这就导致大量深度学习任务都普遍面临着小数据和非平衡的问题,而且
随着微电子技术、通信技术和信号处理技术的快速发展,可穿戴生理信号采集系统成为可能,并逐渐成为研究热点。一方面,如心电(electrocardiograph,ECG)、脑电(electroencephalograph,EEG)、肌电(electromyography,EMG)等生理信号的实时采集,实现了对心血管疾病、癫痫等患者的长期监护,达到了及时治疗和预防的目的,缩短了医患交互的时间和空间,降低了
过去十几年来,用户对带宽的需求一直呈指数级增长,在未来很长的时间里,这种增长趋势会一直保持。作为电信基础设施的骨干技术,光纤通信技术的进步支撑着互联网和移动互联网业务的发展,但受限于熔融光纤的非线性效应,单模光纤传输容量的理论极限大约为100 Tb/s,近几年的实验结果表明,以单模光纤为传输媒介的通信系统的传输容量,已经越来越接近其理论极限,即将面临“带宽瓶颈”。在这种背景下,空分复用技术作为突破
随着“中国制造2025”战略的逐步深化,自动化生产和智能化生产具有越来越重要的地位,作为工业基础的数控机床的重要性也在与日俱增,在航空航天领域中尤其如此。在航空制造业中,为了减轻飞机的重量,同时要保证飞机结构的高强度和较长的使用寿命,薄壁零件成为一种极好的选择,已经被广泛应用于航空制造业中。然而由于薄壁零件具有壁厚较小、体积较大、结构较为复杂等特点,数控机床对其进行加工具有较大的难度,难以保证其加
随钻测井是指测井仪器随钻头一起下井工作,在钻井的同时进行测井工作,并把测量结果实时传输至地面,随钻密度测井是其中的代表技术之一,本文的研究内容就是围绕随钻密度测井仪器展开。测井结果的实时性是随钻测井技术独特的优势,但同时也对仪器的实时数据处理能力有着很高的要求。实时数据处理包括对原始数据的计算和存储,二者在工作流程中的关联性越低,数据处理流程的稳定性越高。Flash均衡算法旨在通过一定的策略,使得