说话人识别系统鲁棒性研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:illyfei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术因其独特的方便性、经济性和准确性,在生物特征识别领域中具有广阔的应用前景。现有的说话人识别技术在理想条件下效果很好,但在实际环境中却由于各种因素的影响,识别效果明显下降。因此如何提高识别系统的鲁棒性已经成为本领域的研究热点。 说话人识别系统的鲁棒性问题涉及系统的各个部分。本文从噪声下的语音检测、鲁棒性特征、训练数据不足和噪声下的说话人建模技术、信道失真补偿等几个方面进行了深入研究,取得了以下具有创新性的成果: (1) 提出了一种基于置信度的动态多特征检测方法。该方法能够根据置信度,动态地选择最佳的检测参数对噪声下的语音信号进行检测。试验结果表明,新方法的检测能力比其它已有的三种检测方法更为稳健,在不同噪声下均表现出较好的检测精度: (2) 提出了一种基于多相滤波器组的基频检测方法。该方法首次将音频压缩中常用的多相滤波器组技术应用到基频检测中,并采用了一种新的清浊音判定方法。对比实验证明,该方法能够比其它常州方法更精确地检测清浊音端点,而且计算复杂度低(乘法次数减少>80%),计算速度明显提高: (3) 提出了一种改进的基频/能量轨迹特征,使此类特征不仅能够应用于文本相关的说话人识别,还能应用于文本无关的情况。在与文本无关的说话人识别验证实验中,动态的特征的引入使识别率提高了5.2%; (4) 提出了一种基于回归类的多特征空间建模方法(RC-MES)。该方法弥补了通常特征空间方法[4.6]昆淆说话人差异和音素差异的缺点,实验结果证明了在训练数据仅有10秒时,新方法能够使识别率提高4.4%; (5) 结合RC-MES方法,提出了一种新的噪声与说话人混合建模方法,较好的解决了有噪声以及训练有限情况下的建模问题。实验证明,新方法的识别率在不同噪声下以及训练数据20s时,均比以前的混合模型有所提高; (6) 提出了一种改进的特征映射方法,改进了原有方法中特征矢量与高斯分量之间的映射关系,更好地解决了特征域信号失真补偿问题。实验证明,新方法不仅更加稳健,而且识别等错误率(EER)从原来的9.86%降低到9.62%; (7) 提出了一种基于径向基函数网络的特征映射方法,利用神经网络良好的非线性函数逼近特点,以及RBF与GMM的天然联系,较好的解决了非线性信道失真补偿问题。识别实验证明,存在非线性失真时,RBF-NFM比没有考虑非线性失真的补偿方法效果更好,等错误率从10.98%降低到9.69%。
其他文献
1.引言《积极心理学视角下的外语学习与教学》一书由Danuta Gabry?-Barker和Dagmara Ga?ajda共同编写,汇集了积极心理学在二语习得、外语教师教育和外语教学方面的最新研究成
在新一代移动通信系统中,频率选择性信道是系统所要面对的一个关键问题。均衡技术是与之对抗的重要手段之一,为了降低均衡复杂度现代无线系统往往采用分块传输,比如CP-SCBT系统
现有城市经济学理论大多基于效率考虑,相关的目标往往表示为生产率、人均收入、效用的最大化或成本最小化。首先,本文创建了两个城镇化理论模型,一个是只考虑效用最大化或自
俄罗斯农村土地制度的转型同社会转型具有一致性,建立混合所有制与促进土地流转是转型时期俄罗斯农村土地制度的两个重要节点,映射在法律上的权利也伴随改革的不断深入从名义落到实际。俄罗斯土地所有制结构直接影响了土地市场的良好运行,研究转型时期俄罗斯土地流转制度,必须从俄罗斯农村土地所有制谈起。而俄罗斯农村土地所有制无论如何流变,背后都能追寻到自古罗斯以来属于斯拉夫民族性所特有的印记。罗马法、东正教、村社传
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
颜真卿作为唐楷艺术的开拓者和创造者,其创立的颜楷书体对中国书法史的影响十分深远。时至今日,颜楷在童蒙书法教育中仍然扮演着举足轻重的角色。在社会广泛学习颜楷的同时,
以不同基因型甘薯品种为试材,研究了不同生态区的产量及块根中营养成分在栽插35—125d生长期间的动态变化。结果表明:泰安试验点,淀粉加工型甘薯品种平均鲜薯产量显著高于鲜食加
基于对机械工程自动化的理解,分析了机械工程及自动化实践开发的重要性,并结合机械工程的智能化、柔性化、虚拟化、集成化说明了实现机械工程及自动化创新实践开发的途径。分
为解决第4代移动通信(4G)大容量高可靠核心技术,本文首次提取ad hoc网络的多用户分集方法及其协作本质,系统地研究了协作能够低成本地提高容量和可靠性并支持可扩展;将该理论