论文部分内容阅读
本文详细介绍了语音信号预处理、端点检测和特征提取的方法,建立了用BP神经网络作为分类器的说话人识别系统。在此基础之上,将小波神经网络的模型引入到识别系统中。实际测试试验表明,基于小波神经网络的识别系统与基于BP神经网络的识别系统相比,网络训练速度加快,识别率也有所提高,是说话人识别的一种有效可行的新方法。
首先回顾了说话人识别技术的发展历史和研究现状,对说话人识别系统的组成、原理进行了介绍,然后对话者识别的预处理、特征提取与识别算法等环节进行了计算验证、性能分析和结果评述,对本文所使用到的几种识别方法:动态时间规整(DTW)、VQ话者识别、基于HMM模型的话者识别、BP神经网络模型,对它们的性能与应用特点进行了比较,重点分析讨论了神经网络的设计原则以及不同的特征参数等对话者识别结果的影响,研究构造了相应的识别模型与算法。在建立BP神经网络的基础之上,将小波神经网络的模型引入到识别系统中。实验表明,基于小波神经网络的识别系统,网络训练速度快,识别率高,在与文本无关的说话人识别中,小波神经网络已成为目前最佳的说话人识别处理模型。
将小波变换和神经网络结合起来应用于说话人身份识别。通过小波变换提取语音信号的基音周期序列不仅体现了人发声时的生理特点,同时还包含了个人说话习惯等后天形成的特征。所以它能有效地反映说话人的语音特点。应用人工神经网络对基音周期序列进行识别分类以确定说话人身份能保证较高的正确率。
最后对所做的工作进行了总结,并指出了存在的问题和下一步继续研究的思路。