基于RBPF与DNN融合的说话人识别

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:dbsoldier
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能化时代下,说话人识别技术可以为用户带来更具个性化的生活服务。目前,以深度学习为理论框架的说话人识别的研究取得了重要性的突破。然而,说话人识别系统的性能在实际应用中仍然面临着挑战。尤其是噪声问题,已成为阻碍说话识别技术未来商业化发展的重要因素。因此,本文围绕噪声环境下如何保持说话人识别性能的问题展开讨论,主要工作内容如下:(1)提出了一种基于边缘粒子滤波(RBPF)与深度置信网络(DBN)融合的说话人识别方法。该方法首先利用离散傅里叶变换将带噪语音信号转换到频域中,然后对每帧频谱数据采用基于低阶时变自回归模型(TVAR)的RBPF进行增强处理。接着利用主成分分析技术(PCA)对增强后频谱数据进行白化处理,提取主成分特征作为DBN的输入,最后通过DBN自适应特征学习对说话人身份进行判别。通过与其他语音增强方法下的说话人识别方法进行对比实验,在不同噪声条件下,所提出的说话人识别方法识别性能更优。与时域RBPF增强方法对比分析,该语音增强方法运行速度提高了约80%。(2)提出了一种基于堆叠扩展降噪自编码(SEDAE)网络的特征提取方法。该方法通过标签约束,引入了说话人辅助信息。在无监督表征学习的基础上,结合有监督学习对编码层参数进行微调。这样提取到的特征不仅具有表征性,而且更适合分类。针对传统半监督学习方法调参难的问题,创新性提出将标签约束下的自编码网络学习过程定义成一个元优化问题,利用元学习方法实现网络的自主学习。最后,将SEDAE提取到的特征输入到卷积神经网络(CNN)进行说话人识别。与基线方法对比实验中,该说话人识别方法表现出更好的鲁棒性。在10dB白噪声破坏下的语料集中测试结果表明,该说话人识别方法平均识别率约为95%,优于基于RBPF与DBN的说话人识别。(3)搭建说话人识别系统平台,实现了门禁系统的声纹控制功能。首先基于MATLAB完成说话人识别算法的搭建以及图形用户界面的设计,用户可以通过语音录制完成说话人识别。然后基于STC89C52单片机完成了继电器控制模块的设计,单片机通过接收来自PC端的指令信号,并对指令数据进行校验解码,实现对继电器的通断控制。最后利用该系统测试了说话人识别算法基于分数层面上的融合模型,并确定了最佳融合因子。
其他文献
液化气是原油加工中的主要副产物,混合C4是液化气的主要成分之一。混合C4中含有少量的1,3-丁二烯,对混合C4加工利用过程中催化剂活性及稳定性影响很大,因此1,3-丁二烯的脱除非常必要。以Ni2P为活性组分的催化剂是一种新型选择性加氢催化剂,具有成本低、加氢性能好及抗毒能力强等特点。论文以氧化铝为载体,在低温条件下制备Ni2P基催化剂,并对其在混合C4中选择性加氢脱1,3-丁二烯的性能进行研究。目
学位
随着技术的发展,汽车行业对于下游产业的要求日益提高,尤其是对于零部件的要求愈加严格。衬芯作为汽车刹车系统的重要组成零件,因其与刹车油输送系统的密封性息息相关,其质量把控非常严格。而在进行衬芯生产的过程中,尺寸缺陷和表面缺陷是不可避免的,这些缺陷将严重影响刹车油输送系统的密封性,进而危及车主的人身安全。目前,针对衬芯的尺寸缺陷和表面缺陷主要是通过人工检测,但是由于检测人员的主观问题可能会导致检测效率
学位
实践中,工程系统(如飞机控制系统,化工或机械系统)通常会遇到一些故障,可能造成很严重的后果。由于大多数系统通常需要较高的可靠性和可维护性,因此故障诊断问题引起了广泛关注。故障诊断一般包括故障检测和故障分离。基于解析模型的故障检测与分离方法能够根据系统模型得到系统运行的状态信息,得到了更深入的研究。在解析模型的基础上,一些学者们提出了基于观测器和滤波器的故障检测与分离方法。但是由于系统模型的不确定性
学位
语音信号是人类信息传递的重要介质,包含了大量的信息,有要传递的文字内容,还蕴藏着我们的情感表达。随着人工智能研究的不断发展,通过语音进行人类的情感识别是科技进步的重要体现,具有非常重大的现实意义。语音情感识别主要是通过对携带有人类情感特征的语音信号分析研究判别人类各种情感变化与类别。其识别过程是使用采集承载人情感信息的语音信号,通过计算机的分析识别,完成对预先设定的几种情感进行判别分类。传统浅层的
学位
振动送料器广泛应用于电子、3C和轻工业等领域的自动化生产和装配中。随着工业自动化和智能化程度的不断提高,在生产装配环节中,对物料供应方式的柔性化要求也越来越高,例如实现物料的多方向传输、堆积物料的分离等。然而,传统振动送料器由于其送料原理和结构所限,无法满足这一新兴需求。本文针对以上问题,以工业市场需求为导向,提出了一种能够实现物料柔性化供应的振动送料系统。本文主要研究内容总结如下:(1)设计了柔
学位
NiTiFe记忆合金因发生热致B2(?)R(?)B19’与力致(B2+R)(?)B19’正逆马氏体相变,可呈现双程记忆效应与超弹性,但呈现双程记忆效应所必需的内应力,需采用预变形训练而影响其应用;同时,R相在加载初始阶段发生变体取向,造成卸载后存在残余应变,而损伤其超弹性。对此,本文设计与制备了Nb纳米线/NiTiFe记忆合金复合材料,试图利用Nb纳米线与NiTiFe基体之间应力耦合,获得无需训练
学位
奥氏体不锈钢具有优良的耐蚀性能,目前广泛应用于石油化工、航天航空、新能源以及核工业等领域。但在其服役过程中,应力腐蚀开裂(SCC)和氢脆(HE)往往是造成其过早失效的重要原因。因此,在一些苛刻的服役环境中,人们往往通过选用镍基合金,或镍含量较高的超级奥氏体不锈钢来预防失效事故,使成本大幅增加。在奥氏体不锈钢中,当镍元素达到一定量后能显著延长奥氏体不锈钢在应力腐蚀及含氢环境下的服役寿命,但具体的作用
学位
在现代战争中,随着作战服和防弹衣的性能提升,躯干和四肢受伤的概率有所减少,但肢体结合部位(腋窝、腹股沟、颈部)由于缺乏有效防护,受伤的概率则大大增加,这些部位分布着大动脉,伤及处往往会伴随着大动脉的破裂导致大出血,对于这些特殊部位的大出血,常规的传统止血装备无法发挥有效止血作用。针对以上止血难题,国内一研究团队提出了一种弹性展开结构的方法,本论文利用Ni Ti形状记忆合金优异的力学性能和超弹特性,
学位
人们生活中对油气资源的依赖与日俱增,所以油井的稳定性至关重要。新型的自膨胀封隔器逐渐取代了传统封隔器,大大提升了完井效率,降低了完井风险。作为其核心部件的原材料,吸水膨胀橡胶的开发及其吸水机理的研究尤为重要。开发出结构稳定、吸水能力强、强度高,可长期使用的吸水膨胀橡胶对油井的开采与开发具有非常重要的意义。丁腈橡胶是油气田中常用的橡胶之一,本文通过在丁腈橡胶以及氢化丁腈橡胶中加入不同的加工助剂,探究
学位
当今社会传统能源消耗严重,开发洁净无污染的氢能成为人们研究的热点。在全球“碳中和”的背景下,油气公司的绿色转型成为必然发展趋势。氢能与油气工业高度融合,中国石油计划在我国玉门油田布局可再生能源制氢产业与试验基地。研究发现光解水是用来产氢的一种有效手段,该技术清洁方便。ZnS形貌多样、价带和导带位置适宜以及光电性能优异,可用来光催化产氢。但是较窄的光响应范围和较短的载流子寿命限制了它的应用。本论文围
学位