论文部分内容阅读
说话人识别是语音信号研究中的一个重要方向,有着重要的理论意义和广泛的应用前景。近些年来,有越来越多的新技术、新方法被应用到说话人识别中来。本论文的目标是将支持向量机应用于说话人识别系统,主要研究内容如下:第一,介绍了本论文中使用的特征参数的提取和GMM统计模型,简单讨论了大数据量的处理;第二,讨论了支持向量机的基本理论,着重介绍了一些基本的算法,它们是将支持向量机应用于说话人识别的理论基础;第三,分析支持向量机技术的优缺点。支持向量机作为数据挖掘中的一项新技术,近年来在模式识别等许多领域取得了与传统方法可比或更好的结果,具有比传统方法更好的分类性能,但是由于它的训练方法非常复杂,难以处理大样本,限制了其在说话人识别方面的使用,另外,支持向量机属于一种模板匹配方法,对语音信号的统计信息不能加以利用;第四,在以上分析的基础上,提出了一种基于GMM统计参数和SVM的说话人辨认系统,首先利用EM算法来处理说话人的大量样本,并将这种方法与矢量量化的方法进行比较,显示了EM算法更好的“聚类”性能;其次,用EM算法处理后的特征向量训练SVM说话人辨认模型,解决了SVM模型训练困难的问题,并且在识别时取得了较好的效果;最后,本文分析了倒谱加权方法在本系统上的应用,通过实验得到了一个适合于本系统的加权窗函数,在与倒谱加权方法结合后,系统的鲁棒性增强,识别性能进一步提高。