【摘 要】
:
近年来,语音识别深入应用到各种不同的场景,抗噪能力也成为语音识别系统评价指标之一。语音识别系统主要包括声学模型和语言模型两部分,声学模型主要基于DNN-HMM搭建,提取MFCC特征系数作为声学模型的输入,语言模型则使用LSTM网络进行搭建。本文所搭建的强噪声环境下的语音识别系统中,声学模型基于DRSN-HMM搭建而成,得益于DRSN的独特结构,DRSN-HMM具有良好的去噪性能;语言模型基于LST
论文部分内容阅读
近年来,语音识别深入应用到各种不同的场景,抗噪能力也成为语音识别系统评价指标之一。语音识别系统主要包括声学模型和语言模型两部分,声学模型主要基于DNN-HMM搭建,提取MFCC特征系数作为声学模型的输入,语言模型则使用LSTM网络进行搭建。
本文所搭建的强噪声环境下的语音识别系统中,声学模型基于DRSN-HMM搭建而成,得益于DRSN的独特结构,DRSN-HMM具有良好的去噪性能;语言模型基于LSTM网络搭建而成,在序列问题的处理上,LSTM网络有性能上的优势。此外,本文还使用序列鉴别性训练、说话人自适应来对声学模型进行优化,使用Word2vec生成词向量代替one-hot作为语言模型的输入;并且使用NOISEX-92噪声数据集与thchs30语言数据集一起制作成不同信噪比的含噪语音数据集。
最后,对文中搭建的强噪声环境下语音识别系统的性能进行测试,测试主要分为两部分:降噪性能的测试和噪声中语音识别准确率的测试。总结不同系统的性能表现,分析出下一步研究目标。
其他文献
砷化镓(GaAs)核辐射探测器自上世纪70年代发展至今,探测器已有较好的制备工艺及探测性能,但GaAs探测器在耐辐照、辐照损伤修复及低功耗等方面的研究却很少,并且一些特殊环境的应用领域对探测器的性能提出更高要求,这些不足都制约其进一步的发展。本文围绕GaAs基核辐射探测器的制备及性能表征、耐辐照性、辐照损伤修复等方面展开了研究。 设计并制备了半绝缘GaAs肖特基型探测器,测试了其电学特性,在偏压
振动式物位检测装置是一种利用压电振动效应原理制成的新型物位传感器,因其能解决在蒸汽、粉尘、泡沫和电磁干扰等恶劣环境下一般仪表无法使用的难题,且在品质、价格上受用户青睐。本文对振动式物位检测装置行业发展状况、课题研究意义及目前存在问题进行了简述,介绍了压电悬臂梁及振动学有关理论基础。 文章基于振动测量基本原理,设计了一种以直棒探头为感知元件的检测系统总体技术方案,并对系统的硬件电路和软件程序进行详
说话人性别和年龄识别是自然语言处理技术的一个子领域,是一项具有挑战性的任务,在人机交互系统中通过说话人性别和年龄特征识别,可以实现为特定对象提供个性化服务。随着人机交互系统的深入研究,用户体验的要求越来越高,该技术逐渐在自动语音查询信息、无人超市、健康护理、娱乐等领域得到广泛应用,并且有望在未来持续增长。 针对语音信号特征提取和建模算法容易受环境噪声影响,性别和年龄识别准确率偏低,年龄识别易出现
海水淡化是有效缓解当前全球性水危机的重要途径。静电雾化太阳能海水淡化技术使用太阳能作为热源,对环境适应性强,并利用静电雾化技术快速扩大单位体积海水表面积,降低雾化海水颗粒粒径,提高热传导效率和蒸发效率。本文通过对液滴在耦合场中的运动力学分析沉积区域控制技术,使得雾化海水颗粒运动至太阳能集热装置有效集热区域,提高海水蒸发效率,并基于研究结果完成了太阳能静电雾化海水淡化系统的自主设计。 本文采用数值
无叶片风力发电系统通过感应荷电雾化装置将液体介质雾化,在风的作用下,雾化后的带电液滴往电场力的反方向运动,从而增加系统的整体电势能,实现风能到电能的转换。液滴荷电雾化是系统中的关键环节,对液滴荷电机理及电荷转移特性的分析,可为雾化系统参数的优化匹配提供参考,以提高系统总的电势能及能量转换效率。 本文通过理论分析、实验对照等方法对静电场作用下的液滴形态变化规律和表面电荷分布规律进行研究:基于双电层
随着无线通信技术和物联网技术的发展,室内定位的应用需求越来越多。超宽带(Ultra-Wideband,UWB)通信技术凭借其精度高、传输速率高、复杂度低、功耗低、穿透能力强、抗干扰性好等优势,在高精度室内定位领域被广泛使用。室内定位系统的难点包括:多锚点多标签环境中的无冲突通信和定位;定位网络中,节点加入和退出网络等网络管理;多锚点环境中标签定位锚点的实时切换。 针对以上难点,本文基于超宽带通信
该篇论文对添加剂改善微波陶瓷BaNdTiO的介电性能及其机理进行了研究和探讨,微波陶瓷BaNdTiO系统的介电能包括介电常数εr、品质因数Q温度频率系数τf等,这一系统主要具有优良的介电常数εr(80-90),但频率温度系数τf较高(+85ppm/K),需要另加入添加剂来进行调节,以满足实际应用中的需求.该篇论文主要研究利用添加剂PbO和BiO对频率温度系数进行了调节,不同百分比的PbO和BiO添
该论文采用等离子体增强的化学气相沉积(PECVD)生长技术,原位制备了SiO/nc-Si/SiO的纳米结构.实验中我们首次采用等离子体氧化的方法,获得了作为隧穿氧化层超薄SiO层,并利用layer by layer的方法制备了纳米硅层,然后再用等离子体氧化的方法形成栅氧化层.我们通过对基于硅纳米晶粒的MOS结构的电容电压(C-V)测量,研究了硅纳米晶粒的电荷存储现象.
超宽带(Ultra Wide Band,UWB)通信系统可以利用频带极宽的信道来传输信息,与传统窄带通信系统相比具备更高的传输速率,是未来通信行业研究的热点问题,进行准确的信道估计是保障超宽带通信系统可靠性的关键因素。传统的超宽带信道估计方法,在估计精度、频谱利用率上均有待提升,而压缩感知理论通过利用稀疏信号的特性,能够以较高的估计精度完成超宽带信道估计工作。本文旨在通过对压缩感知理论中重构算法的
空间信号的波达方向(Direction of Arrival,DOA)是指利用传感器阵列接收的信源信息,提取出空域信号的角度参数,从而确定信号发出的位置。经过多年的研究,出现了测向性能较好的超分辨测向算法。论文主要对超分辨测向技术关键问题展开深入研究,包括窄带独立信号DOA估计的优化改进、色噪声背景下相干信号测向实现、宽带混合信号DOA估计。论文首先研究窄带信号、相干信号、宽带信号模型,然后对几个