论文部分内容阅读
说话人识别就是通过对话者的语音进行处理来实现对说话人的身份的判别。语音易获取,不像钥匙和卡一样需要随身携带,不会对人体舒适度产生影响,语音不会丢失,在日常生活中的使用十分方便。由此可见,相关说话人识别产品的开发必定会给人们的日常生活带来极大的便利。然而,说话人识别在经历了一段时间的快速发展之后,在比较长的一段时间里都没有跨越性的发展。但是一些学者和机构有的提出了自己的方法,有的在原有算法的基础上提出了一些改进的和融合的方法。例如一些学者在对语音学深入研究的基础上,提出了一些对说话人的个性特征具有较强表征能力的有效特征集的选择方法,并取得了比较好的实验结果。但是迄今为止,人们并没有深入到语音的本质,并没有将说话人的个性信息和语义信息提取并表征出来。因此,对语音深层次的研究有待深入。本文首先对说话人识别的基本理论和一些基本方法进行了介绍。并建立了基于高斯混合模型(GMM)的说话人识别系统,提取表征说话人身份的有效语音数据并进行建模和评估。在对说话人识别相关的理论分析和大量的针对性实验的基础上提出了一种基于有效特征集选择的说话人识别方法。对表征说话人特性的特征数据进行了个性和共性的有效划分,实验证明提出的方法是合理的、有效的。并在此基础上,结合一些好的方法,提出了基于有效融合方法的说话人识别方法,经实验验证,提出的方法有效地提高了说话人识别系统的识别性能。高斯混合模型和最大互信息的结合提高了说话人识别系统的综合性能。在此基础上,进一步融入了有效特征选择的方法,使得说话人识别系统性能得以进一步提高,使系统更加完善。另外,对基于浊音语音的说话人识别方法进行了分析,实验证明浊音语音对说话人身份的表征是比较有效的。课题研究中还建立了基于matlab的实时说话人识别系统,在普通的学生宿舍环境下进行测试,取得了比较理想的判别效果。