在噪声环境下的说话人识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:wangjinshui6699
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别的研究有几十年了,因此有些技术已经很成熟。尤其是与文本相关的说话人识别已经商品化。但是与文本无关的说话人识别,因为事先不知道文本的内容,所以就困难得多,但是这也是吸引人的地方,所以正是人们的研究热点。而且,虽然说话人识别在纯净语音环境中取得了令人满意的结果,但是一旦到了噪声环境下,说话人的识别率就会急剧地下降。这就牵涉到说话人识别系统的鲁棒性问题了。因此本文着重研究在噪声环境下的说话人识别。本文所做的工作主要如下:(1)针对在噪声环境下的说话人识别系统做了两点改进。第一,为了提高系统的鲁棒性,通过不同尺度的小波基,把含有噪声的信号分解于不同频段中,然后在各个频段分别通过TEO(Teager能量算子)去噪。针对说话人识别的特点,在小波重构时对各小波系数进行了加权处理。再把各个频段的输出通过小波重构恢复信号。最后通过Mel滤波器组把小波系数转换成MFCC。第二,为了进一步提高识别性能和训练速度,我们在识别阶段采用了改进的OGMM(正交高斯混合模型)即把正交变换改到EM算法之前进行,这样就不必要在EM迭代过程中每次都进行正交运算了。从实验得出,采用我们提出的DWT-TEO参数对于说话人识别的效果较好。采用改进的正交高斯混合模型进一步提高了识别性能和训练速度。(2)KLT已经成功用于与文本无关的说话人辨认的特征提取,但是对于特征矢量分解,它需要巨大的计算负担。为了减轻计算负担,把Karhunen Looeve变换(KLT)和重叠子帧合并起来用于噪声环境下的说话人辨认。基于重叠子帧的分离方法,我们提出了一种有效技术去建立特征矢量矩阵和取得KLT技术的优点的有效性。在传统的MCE方法中,对于有K个说话人的系统而言,每一类别的分类错误都需要计算K-1类的判别函数,随着K的增加,使得计算量大量增加,于是提出了一种改进的MCE模型去减少计算量,并进而提高运算速度。实验结果显示:所提出的方法确实减少了计算量,而且提高了系统的辨认率。(3)采用了改进的小波去噪方法对含噪语音进行了前端处理,并且针对说话人识别的特点,在小波重构之前对各小波系数进行了加权处理;识别过程采用了GMM识别算法。实验结果显示,本文所提出的方法对于含噪说话人识别有着比纯粹使用MFCC作为识别特征的说话人识别有明显的优越性。所提出的方法对进行实时的说话人识别有很好的指导作用。(4)高斯函数的线性组合能描述大量的采样分布,因此GMM具有计算的有效性和易于实现的优点,特别是在实时平台上。基于ML规则,模型参数不断更新,直到观察序列的概率的一些极限点。然而实际上,由于爬山特征,任意的原始模型参数估计通常将导致局部最优。遗传算法(GA)是近年来发展起来的强有力全局搜索工具,特别适合于求解复杂组合优化问题及非线性函数优化。提出了基于说话人识别的可以解决GMM局部最优问题GMM/GA新算法。实验结果显示,提出的GMM/GA新算法比纯粹的GMM算法能获得更优的效果。(5)去噪的目的是去掉噪声和保留尽量重要的特征。近来,用非线性处理的信号去噪,如小波变换已越来越普遍。对于小波阈值,使用了根据估计值变量和偏差的能显示软硬阈值的半软阈值函数。GMM普遍用于说话人识别系统中,并且在宽带语音中表现出了很好的性能。然而,在噪声环境下,性能急剧下降。GMM的另一个困难是需要至少几分钟的训练语音,这对实时应用是不适用的。另一方面,ANN需更少的训练数据。所以联合概率神经网络(PNN)和GMM去提高系统的性能。试验结果显示,所提出的方法有利于噪声环境下的说话人识别。
其他文献
在商业银行不断成长的过程中,利息收入依存度过高仍旧是其正在面临的急需解决的问题。本文以2010年至2015年间上市商业银行披露的财务信息为基础,分析各类商业银行的利润变动
基于高中德育对促进学生全面发展,推进高中新课程改革,落实素质教育所具有的重大价值和意义的认识,本研究调查了攀枝花市高中学校德育开展情况,结合自己在平时的教学、教研活动中
信息系统的安全性受到越来越广泛的关注,密码技术是实现信息系统安全的重要保证,公钥加密技术和数字签名技术是密码技术的两个重要组成部分。为解决公钥密码技术中用户公钥和
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
茶食品是在茶产业基础上发展起来的新兴产业,以其品种多样,口味独特在茶产业市场中占据了一隅之地。营销网络的建设对于茶食品来说是极为重要的,主要作用于茶食品的推广销售
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
近年来农村出现的农户承包土地使用权流转,有助于发挥土地资源效益和农民增收。土地使用权流转是一种法律行为,当事人双方应当依法签订书面合同。由于多种原因,目前在土地流
莫泊桑《项链》的主题众说纷纭,莫衷一是,但只有遵循了小说这种文体的特征去解读,才能靠近作家写作目的。抓住小说中的差异性或矛盾性,即"马蒂尔德的爱慕虚荣与她的十年艰辛"