深度神经网络技术在汉语语音识别声学建模中的优化策略

来源 :重庆邮电大学学报(自然科学版) | 被引量 : 12次 | 上传用户:weihc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将深度神经网络作为声学模型引入面向汉语电话自然口语交谈语音识别系统。针对自然口语中识别字错误率较高的问题,从语音的声学特征类型选择、模型训练时元参数调节以及改善模型泛化能力等方面出发,对基于深度神经网络的声学模型建模技术进行了一系列的优化。针对训练样本中状态先验概率分布稀疏的情况,提出了一种状态先验概率平滑算法,在一定程度上缓解了这种数据稀疏问题,经平滑后,字错误率下降超过1%。在所采用的3个电话自然口语交谈测试集上,相对于优化前的深度神经网络模型,经过优化后的模型取得了性能的一致提升,字错误率平均
其他文献
素质是一个人知识、修养、品行的具体表现,护士个体素质直接影响着病人的身心健康.好的素质可使病人产生亲切和信赖感,尽快适应新环境,使病人在临床治疗方面保持积极合作态度
期刊
本文讨论速率为8 ̄16kb/s的语音压缩编译码器的设计及实现。选用TMS320C25作主处理器,在一片上实时实现了由两对编译码器构成的双向通信系统。
在数字调制分类中,信号的相位周期特性会形成相位的卷叠并降低对接收到的射频信号的自动数字调制正确分类的概率。根据多进制数字相位调制(multiple-level phase shift keying,MPSK)信号的相位特征,通过相位去卷叠、根据最小均方误差原则去线性相位分量,以及相位的模π运算,提出了一种MPSK信号的分类方法。实验结果表明,基于相位特征的通信信号的自动调制分类算法具有很强的鲁棒性
井筒井壁注浆是广泛用于矿山凿井的特殊工艺,解决了井壁裂隙涌水的问题,但是在一些特殊条件下,井壁微裂隙的可注性极差,导致注浆效果并不理想。文章主要研究微裂隙压水扩缝复合注
长波红外图象信息处理机是一种专用多处理机,它具有典型的MIMD结构。其监控软件分布在主机,控制器和各个处理单元上,用于向控制器和各个处理单元装载,控制、监视以及调试用户程序。为
针对我国煤炭储量与产量主要集中在“三西”的实际,文章从宏观角度分析“三西”煤炭主要外运通道的现状、建设新通道的必要性和可带来的经济与社会效益。
新兴的物联网技术为综合性智能家居测控系统的构建准备了条件,门禁系统作为智能家居的核心子系统之一,其安全控制的实现有助于提升智能家居的性能和用户体验。针对现有门禁系统存在的控制安全问题,提出了基于持卡人、门禁卡、读卡器三结合的认证机制、保密通信机制和时间戳机制的智能家居门禁系统安全控制方法,建立了近程刷卡控制和智能终端远程控制2种方式,实现对门禁系统通信数据的机密性和完整性保护,并阻止门禁控制指令被
近年来,训练模拟器得以广泛应用。其中,视觉效果模拟是一个重要方面。本文介绍的正是用录象机来实现视觉效果模拟。首先,介绍录象机重放的基本原理。为了获得干净而稳定的图象所
双扇形贴片天线具有双频或宽频带特性,已有广泛应用。本文给出一些经验公式,以便在不同频段、不同基片厚度、不同介电常数条件下,实现统一的、灵活的简化工程设计。
本文实现了1.3μm40km光纤微波副载波复用多路卫星调频电视传输系统实验。系统中的光电组件均为国产。测量并分析了系统的载噪比特性,两者相符得很好。40km光纤的总损耗为17dB。该系统经受了长