论文部分内容阅读
语音信号中包含着许多信息,例如语音的内容、语音的语种、说话人的性别和身份信息等。说话人识别技术是将语音信号中表明说话人身份的特征提取出来,再利用这些特征来辨别说话人身份的技术。说话人识别不但具有不会遗忘、不需记忆、使用方便等优点,还有其独特的优势,如:传感器成本低、非接触性、可用于远程验证等,已经逐渐发展成生物认证领域的关键技术。最小二乘支持向量机是说话人识别系统中运用较广泛的一种方法,其本质上是标准支持向量机的一种改进形式,优势在于样本训练速度快、有效克服“维数灾难”问题以及易于实现。不过,由于其不具备标准支持向量机解的稀疏性性质,所以导致系统复杂度变大同时影响识别效率,针对这个问题进行研究,提出将高斯混合模型与改进最小二乘支持向量机结合的方法。首先,对最小二乘支持向量机进行深入研究,并且将其运用到说话人识别系统中,避免对先验知识的需求以及“欠学习”、“过学习”情况的出现。然后,考虑解决系统的学习能力以及抗噪能力的问题,重点研究选择模型参数的方法,采用K折方法对参数进行优化。紧接着,引入K均值预选算法及快速剪枝算法,并将其与最小二乘支持向量机结合起来,用以弥补最小二乘支持向量机解的稀疏性不足的问题。最后,考虑常用的多分类算法存在无法分割的区域,将模糊算法与稀疏最小二乘支持向量机结合。实验中对矢量量化方法、对数似然度方法以及标准支持向量机方法进行比较,结果显示在综合考虑算法效率以及识别率时,支持向量机效果最好,紧接着在不同大小语音样本库前提下,将标准支持向量机、最小二乘支持向量机以及稀疏最小二乘支持向量机的多项指标作对比,可以得出稀疏最小二乘支持向量机算法效率及识别率有所改进,最后将稀疏最小二乘支持向量机与模糊最小二乘支持向量机进行比较,可知模糊最小支持向量机识别率更高。