论文部分内容阅读
在信息化高度发展的当今社会,如何准确识别一个人的身份,保护信息安全是当今信息时代必须解决的一个关键社会问题。基于生物特征的身份识别技术以其方便、快捷、安全、可靠等优点成为未来替代钥匙、密码、智能卡等传统身份识别技术的最好选择。已有的生物特征身份识别技术都是基于单一生物特征的,这种单模态身份识别技术由于其自身的局限性如传感器噪声、特征提取和模型匹配的缺陷以及生物特征实际存在的不普遍性(如特殊人群生物特征缺失、损伤、病变或质量较差)等使得这项技术实际应用起来困难重重。基于数据融合技术,利用不同生物特征之间的互补信息,最终得到综合身份判断的多生物特征融合身份识别技术很好地解决了以上问题而被研究者认为是未来身份识别的发展方向。本论文从说话人识别和人脸识别两种单模态身份识别技术入手,在以往研究基础上,分别对这两种技术作了详细地分析探讨并加以改进;然后,在匹配层采用多种融合算法对人脸图像和语音信号两种生物特征建立融合系统用于身份识别;随后提出了一种比较新的身份识别方法:唇动身份识别技术,并在唇分割检测、特征提取以及识别模型三方面做了较为深入地研究和探讨;最后提出了基于网格技术的生物特征身份识别平台的设计构想。全文具体研究内容如下:针对传统说话人识别VQ模型分类能力不强,SVM模型分类能力较强但在大规模训练样本下训练算法复杂的现实情况,本研究提出了一种VQ与SVM相结合的说话人识别模型。实验证明这种模型可以更好地发挥两种模型的优点,提高说话人识别系统的性能。此外,在回顾并总结了人脸检测和识别技术的基础上,利用肤色和高斯模型建立了一个人脸检测系统,并在简单背景下取得了较好的实验效果,人脸识别系统采用特征脸方法并在数据库上验证了系统的性能。语音信号和人脸图像两种生物特征独立性强,不存在很强的关联性,本研究采用后期融合策略,融合语音和人脸子模块输出匹配分数来提高身份识别的准确率。融合算法采用自适应加权融合、D-S证据理论、神经网络三种方法。实验证明,融合系统的识别率都要比单一模态系统高,特别是在环境比较恶劣的情况下(语音或人脸图像中加入噪音),两种单一模态系统的身份识别率快速下降,而融合系统能保持在一个比较好的水平上。嘴唇检测、定位和唇动特征的提取是唇动身份识别的前提,计算机自动唇检测却是非常困难地。本论文在已有的灰度图像嘴唇分割方法上,利用Fisher变换在彩色空间增强唇色和肤色区分度,并采用自适应阈值在灰度图像上分割唇部区域。此算法简单而有效,把分割后的唇部参数作为有效模板的初始值在视频图像中来唇轮廓检测实验效果比较好。在特征提取方面,除了唇分割后直接提取的几何特征外,利用DCT变换和PCA变换后的系数作为唇动像素特征,这种方法可以在达到降维目的的同时保留原有特征的主要信息。语音的视觉特征是对听觉特征一个很好的补充,人们说话时的唇形变化也可以表征一个人的说话习惯特征,所以把唇形变化作为一种新的生物特征身份识别依据或和语音结合识别都是一个好的尝试。本论文在对说话人视频图像唇动特征提取后,利用HMM模型在特征层连接语音信号特征建立融合模型进行身份识别。系统在HITLUDB音视频双模数据库上进行了性能测试。生物特征数据库、识别模型、用户和研究者等等都存在着动态性、分散性和差异性。网格是分布式、异构资源的集合,在支持大规模应用和提供计算能力方面性能显著。本文提出了一种基于网格技术的生物特征识别系统平台设计构想。通过这个平台可以创建一个协作环境来连接分布式的用户、模型、生物特征数据库等软硬件资源,提供单模态和多生物特征融合身份识别功能以及统一的测试平台功能。身份识别是当今社会不可避免的一个问题,生物特征身份识别作为一种安全而有效的手段一直受到广大研究者的重视。针对单模态生物特征身份识别技术的局限性和实际应用中的各种限制,本论文就最近兴起地基于数据融合技术的多生物特征身份识别进行了研究和探讨。这项工作虽然还处于刚刚起步阶段,但是,作为信息安全不可缺少的重要手段,它的研究和应用必将引起大家的重视而飞速地发展。