舰船VDR人声识别技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:cmdl_CQ
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人声识别系统的鲁棒性(Robustness)是影响其走向实际应用的关键,其中噪声和变异是影响系统鲁棒性的主要因素。由于人声模型较难以建立,所以对于非特定人的识别就更为困难。在对噪声影响的研究中人们发现,随着外界噪声强度的增加,人的情绪和发音方式也会发生变化。本文主要研究舰船航行数据记录仪(Voyage Data Recorder, VDR)环境下的人声识别,分别从基于特征和基于模型角度提出可以在噪声环境下进行人声识别的有效方法。从基于特征的角度出发:首先根据人耳对不同频段的感知程度不同,提出了结合人耳响度特性的子带分频加权算法来降低噪声对MFCC的影响,加权的原则是对识别贡献率较大的子带赋予相对较高的权值,反之则赋予相对较低的权值;其次,针对语音产生过程中存在的非线性现象,通过对非线性AM-FM模型的深入研究,本文提出了改进的MFCC特征系数加权算法,使用该算法提取的MFCC特征能有效利用语音信号中的幅值包络和瞬时频率信息,同时又兼顾了耳蜗子带分频特性,使系统的识别率有一定的提高。同时,采用最大相对熵权值对MFCC特征系数加权,一定程度上解决了不同特征维受环境影响不同的问题,提高了系统的鲁棒性。从基于模型的角度出发:采用Reynolds提出的自适应目标模型方法为人声建立公共背景模型GMM-UBM,并提出了一种基于GMM-UBM的开集动态阈值搜索算法。该算法可以对系统阈值进行动态跟踪设定,实现了系统开集状态下的人声识别,GMM-UBM具有屏蔽背景噪声的作用,不仅很好的解决了模型的训练速度问题,而且使用小训练样本就可以训练出与人声UBM模型具有相同混合度的话者模型,进一步提高了人声识别系统的性能。另外,在预处理阶段提出了基于近似熵的动态自适应阈值端点检测算法,较好的解决了舰船噪声对识别系统的影响,试验结果证明该算法优于自适应子带谱熵端点检测方法。
其他文献
针对西气东输管道工程和其它顶管施工工程中经常出现的问题,结合设计规范要求和实际经验,对顶管过程中出现质量问题的影响因素进行了分析,提出了误差校正和缺陷处理的方法。
提出一种新型的电磁铸造工艺——异相位电磁铸造,并在Al—Mg-Si系合金水平连铸过程中进行实验。异相位电磁铸造技术是通过对常规铝合金铸造用的结晶器结构进行改进,在其外围配
腹膜后纤维化是一种病因不明的胶原血管病,其特征是腹膜后慢性非特异性炎症伴纤维组织增生,包绕压迫输尿管和腹膜后腔其他脏器,继发肾盂积水,从而产生腰腹部疼痛等临床表现。
菜单是手持移动设备界面的重要交互部件,手持移动设备功能增加带来的菜单规模增大与手持移动设备小屏幕形成日益突出的矛盾。三维界面技术可以提高界面信息容量,因此,在手持
大庆至铁岭双线输油管道是目前我国最大的输油管道系统,通过优化运行降低其能耗,对提高该管道的经济效益具有重要的意义.利用专用软件QTOPT对该系统在多种条件下的稳态优化运
随着我国城市化进程的飞速发展,基于高架桥的建设构筑城市化交通空间已是大趋势。应用有限元方法,根据场地地震危险性分析得到的地震动参数,对某高架桥进行系统的抗震分析过
介绍了BEM-5P原油降凝剂在大港油田万周输油管道上的现场试验情况.试验结果表明,BEM-5P降凝剂对万周管输原油具有较好的降凝降粘效果.加剂运行可降低管道启输量和安全运行温
随着宽带网络的飞速发展以及新型组播业务的不断涌现,用户对高品质的组播服务需求以及高可靠的组播业务传输质量的要求都在不断的提高。传统的IP组播技术由于所采用的网络带