论文部分内容阅读
说话人识别技术是当今的一个研究热点,在保安、公安司法、军事、财经和信息服务等领域有广泛的应用前景。在纯净的语音下,识别的效果比较好,但是在有噪声的情况下,识别率比较低。针对这种情况,笔者展开了一系列的研究,主要的工作如下:1.分析了当前说话人识别的发展现状、技术难点及需要改进的方向,并研究了与之相关的语音信号处理的内容。2.讨论了两种说话人识别算法:矢量量化(VQ)和高斯混合模型(GMM),针对两种方法建立了与文本无关的说话人识别系统,并用MATLAB仿真实现。3.针对目前说话人识别特征提取的不足,研究了用主分量分析(PCA)、基于Fisher准则线性判别分析(FLDA)、PCA+FLDA方法对MFCC提取后的特征进行变换的方法。另外还研究了用小波变换方法对说话人特征进行改进,研究表明改进的方法能够取得较好的效果。4.研究了麦克风阵语音增强技术。详细分析了延迟求和波束形成、自适应波束形成和基于子空间的阵列语音增强方法,并且研究了用小波变换的方法进行语音增强,并将小波变换方法后置于自适应波束形成方法,最后对各种方法进行了仿真实验。5.将麦克风阵语音增强和PCA+FLDA的特征提取方法用于低信噪比下的说话人识别中,大大提高了噪声环境下的说话人识别率。