论文部分内容阅读
近年来,随着互联网热潮的冲击,信息科技的飞速发展,人们对信息以及财产的安全重视程度不断提高,而身份识别又是信息安全最重要的环节。在科技高速发展的今天,现有的生物特征识别技术虽然便捷可靠,但也面临着或多或少的安全问题,引起了国内外相关学者的高度重视。任何一种单一的识别方式都不能满足人们的现实需要,目前研究主要集中在多模态融合识别和探索新型的生物识别技术,基于心电信号(electrocardiogram,ECG)的身份识别技术就是新型生物识别技术的代表。在这样的背景下,本文综合分析了现存ECG身份识别算法的一些优缺点,为了改善身份识别的效率和准确度,满足算法实时化的实际需求,论文进行了相关的研究工作,主要创新工作分为以下几个部分:1.提出了基于PCA-RPROP的ECG身份识别算法。利用小波去噪算法和差分定位法取得周期性纯净心电信号后,在基于单独R点定位提取完整心拍波形的基础上,利用PCA白化(Principal Component Analysis Whitening)消除心拍点之间的相关性,将多维特征转化为低维特征。新特征保留原有特征的90%以上的有用信息,消除了特征冗余。采用神经网络代替传统的有监督分类器,并采用RPROP(Resilient Propagation)算法对神经网络的梯度进行底层优化,提高其收敛性。结合PCA白化特征和RPROP算法提高神经网络的分类效率。这种方法解决了定位复杂问题以及身份识别传统特征的冗余问题,减小计算量的同时提高准确度,形成完整的技术体系。实验结果表明,本方法特征提取简单,分类器优化结果显著,大大提高了身份识别的训练速度和精度。2.提出了基于随机森林的ECG身份识别方案。为了更加适应实际工程应用的需求,针对支持向量机(Support Vector Machine,SVM)核函数训练耗时大,神经网络的众多参数调整以及黑盒模型的不可解释性等缺陷。在实际应用领域,可能会出现训练失败,数据偏移等场景,稳定性稍显不足,而且参数调整影响巨大。因此,我们寻求一种更具应用性的识别方案,基于集成学习思想的随机森林的识别算法解决了这个问题。以CART决策树为单位,构建特征森林,解决单一分类器性能不足的缺点,并融合PCA和小波特征验证其泛化能力。在ECG身份识别中,准确度和泛化性均优于以上的识别方法。通过不同的实验方案对比,结果表明,基于PCA-RPROP的ECG身份识别算法,其准确率达到96.6%,比核SVM提高了2.4%,在时间效率上比K-近邻(k-Nearest Neighbor,KNN)提高了14s,在内存资源消耗严重的神经网络模型中,本文方法同样优于传统的L-M(Levenberg-Marquardt)等常用方法。而基于随机森林的ECG身份识别方法更是将准确率提高到了97.7%,且在融合了PCA特征和小波特征后,并没有因为特征的多样性导致识别效果变差,表明其泛化能力和鲁棒性较强,由于其调整参数简洁,模型透明,非常适合实时化应用的工程要求。