论文部分内容阅读
说话人识别技术作为生物识别技术的一种,因其所具备的方便性、非交互性、准确性等特点被广泛应用于生物识别领域。现有的说话人识别算法在实际使用时,受到信道干扰、环境噪声及说话人语音长短等不同因素的制约,其识别准确率往往受到较大的影响。因此本文针对短语音的说话人应用场景下,提出对提取到的说话人i-vector特征矢量运用多核SVM进行分类判决,以此提高对于短语音的识别准确率,并将其应用于巡检系统进行测试。首先,本文对语音信号处理技术进行了研究,选择了符合人耳特性的MFCC特征参数。对基于i-vector的说话人识别技术进行深入研究与实验,训练了GMM-UBM模型,以此获得说话人的i-vector特征矢量,并通过LDA进行信道补偿。其次,对多核SVM技术进行研究,设计了基于多核SVM-i-vector的短语音说话人识别系统,对不同核函数分别进行实验,得到各核函数使系统识别率最高时的参数,并基于这些参数将核函数进行各种线性组合,通过实验选取使系统识别率最高时的组合,将该组合下系统识别率与使用单核SVM及不使用SVM的系统识别率进行比较,并分别在不同语音时长及噪声环境下进行实验。实验结果表明使用多核SVM对i-vector特征矢量进行分类判决可以获得较好的系统识别率,并且在语音时长越短时,其识别率提高越明显,表明其更好的适用于短语音应用场景。接着,将基于多核SVM-i-vector的短语音说话人识别技术应用于巡检系统,设计系统总体架构及系统流程,并通过实验对系统进行测试。测试结果表明系统具有良好的稳定性及可行性。最后,对本文工作任务进行总结,并对系统的不足加以分析,展望后续研究方向。