论文部分内容阅读
当今时代,生物学身份验证的应用领域越来越广泛,然而相关研究表明:生物学验证技术比较容易遭受恶意欺诈攻击。虽然对电子欺诈检测的研究已经取得了一些研究进展,但这个问题仍有诸多难点尚未攻克,生物学身份验证系统依然很容易受到欺诈攻击的影响。说话人验证系统作为一种典型的生物学验证系统,其可靠性和安全性都需要欺诈检测技术来确保。近年来,重放攻击检测技术已成为说话人识别电子欺诈检测领域的研究热点,该领域急需新的研究方法来解决重放攻击电子欺诈检测这一问题。为提升重放攻击检测方法的性能,本文将对基于声学信号处理的检测方法以及基于深度学习的检测方法进行较为深入的探索。在基于声学信号处理的检测方法中,本文首先从信号传播的角度对重放攻击特性进行理论分析,论证了高频特征用于重放攻击检测的可行性,进而通过提取高频声学特征以及多种特征处理方法进行说话人验证中的重放攻击电子欺诈检测研究,进而提高重放攻击检测的性能。在基于深度学习的检测方法中,本文将通过构建深度神经网络来提取瓶颈特征(Bottleneck Feature)并应用集成学习方法分类来进行重放攻击欺诈检测研究。本文对重放攻击特性进行了深入研究,并针对重放攻击检测问题对逆梅尔倒谱系数(Inverted Mel Frequency Cepstral Coefficient,IMFCC)[1]进行了改进,提出了修正逆梅尔倒谱系数(Correction Inverted Mel Frequency Cepstral Coefficient,CIMFCC),所进行的改进也包括布莱克曼窗函数以及均值方差归一化的应用。实验表明,CIMFCC是一种可以有效检测欺诈语音的声学特征,基于CIMFCC的检测方法相较于基线系统等错误率(Equal Error Rate,EER)[2]相对下降达51.06%。为解决改善声学信号处理方法中高频区分性信息损失问题,本文提出了基于深度学习的瓶颈特征,将卷积深度神经网络(Convolutional Deep Neural Network,CDNN)作为捕捉频谱高频区分性信息的特征提取方法,瓶颈特征由CDNN中的瓶颈层生成,瓶颈层将与分类相关的信息强制转换为一个低维度的表示,即瓶颈特征可视为输入特征的低维度非线性表示,同时实验表明,瓶颈特征对欺诈检测问题是一种更为有效的检测特征。以瓶颈特征为基础的模型在评估集上表现出了最好的检测性能EER为8.40%,同时实验表明,集成学习模型要比简单的机器学习模型更为适合解决重放攻击检测问题。