论文部分内容阅读
随着信息技术和网络通信的快速发展,人们对信息安全性的要求越来越高,说话人识别技术,凭借其较高的安全性和便捷的使用方式,广泛地被应用于互联网和通信领域,完整的说话人识别系统由预处理、特征提取、模式匹配和判定这几块共同构成,自Bell实验室的L.G.Kesta提出了“声纹”的概念后,大量学者针对说话人识别技术中不同模块展开研究,收获颇丰。目前,与文本相关的说话人识别技术的研究相对较为成熟,识别性能较好,但是与文本无关的说话人识别技术性能的提升空间还很大,除此之外,由于现实生活中绝大部分的语音信号都含有噪音,而传统的说话人识别算法大多针对干净语音,因此寻找一种鲁棒性较好的说话人识别技术也迫在眉睫。另一方面,近几年,压缩感知理论受到国内外的广泛关注,该理论突破了奈奎斯特采样速率的限制,对可压缩信号在采样的同时也进行压缩,将压缩感知这一新理论与说话人识别这一亟需突破的领域相结合,为说话人识别系统性能的提升带来希望,具有重大的实际应用价值。 本文在对压缩感知理论和说话人识别技术进行深入学习的基础上,针对与文本无关的说话人识别技术,做了以下工作: 1)研究了稀疏表示理论在模式识别领域中应用,分析了稀疏表示理论和压缩感知的联系与区别,提出用组合特征矢量训练GMM均值超向量,并以此为基础构建稀疏基,随后提出了一种基于压缩感知稀疏表示的说话人识别算法,为两种理论的结合开辟了思路; 2)深入研究了贝叶斯框架下的压缩感知算法,给出了区别于传统重建算法的贝叶斯重建算法,鉴于该算法得到的解更接近于最小l0范数的解,率先提出了基于贝叶斯压缩感知的说话人识别算法; 3)针对基于压缩感知的说话人识别算法中的稀疏系数的特点,引入半高斯先验,详细分析基于该先验的贝叶斯压缩感知后,提出基于近似贝叶斯压缩感知的说话人识别算法; 4)针对说话人识别系统在噪声环境下识别率普遍较低的问题,在详细分析语音信号和噪声信号稀疏性差异后,提出了一种基于压缩感知的语音增强算法,并将其应用在说话人识别前端。 本文最后对所做的工作和成果做了总结,并对今后的工作进行了展望。