基于DNN-LSTM的VAD算法

被引量 : 0次 | 上传用户:a67826766
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度神经网络(Deepneuralnetwork,DNN)的语音活动性检测(Voiceactivitydetection,VAD),忽略了语音帧特征在时间上的相关性,随着信噪比的降低性能会明显下降。本文提出了一种基于DNN-LSTM(长短时记忆单元,LSTM)的VAD检测算法,进一步对语音帧特征序列的动态信息加以分析利用。同时结合DNN-LSTM结构提出一种基于上下文信息的网络训练代价函数。实验语料基于TIDIGITS语音库,使用Noisex-92噪声库加噪。实验结果显示,在不同噪声环境下DNN-LSTM的VAD比基于DNN的VAD方法有更好的性能,新的代价函数比传统的更适用于本文提出的算法。
其他文献
目的分析医院门诊患者常见投诉原因,并提出针对性对策,以提高医院门诊服务质量。方法收集整理2013年8月~2016年8月北京某军队医院门诊办公室记录的患者投诉资料,筛除无效投诉
<正> 各位理事、同志们: 广西职工思想政治工作研究会三届二次年会今天开幕了。我受常务理事会的委托,向大会作工作报告,请予审议。 一、1993年工作的回顾 去年,我们广西职工
<正>近日互联网档案馆官方公布了其新建的唐纳德·特朗普档案,内容包含了700多份电视演讲、采访、辩论以及其他与特朗普有关的新闻报道。互联网档案馆还会借助庞大的美国政府
马钢第一钢轧总厂中板线二辊区域辅传动由模拟量控制系统改造为西门子数字量传动系统。介绍了改造原因、设备功能、传动系统选型依据及具体调试方法。
<正>当前和今后一个时期,全省各级政研会组织要深入贯彻党的十八大、十八届三中、四中全会精神和习近平总书记系列重要讲话精神,主动适应新常态,着力巩固全省人民团结奋斗的
<正>美国是新媒体的发源地,美国的档案学教育与档案学研究起步也比较早。同时,美国出台一系列档案相关法律保障公众知情权,优化档案网站的服务质量,美国档案网站的信息传播也
诚信是饭店在经济社会中生存与发展的前提,更是提高饭店服务竞争力的关键。饭店职业经理人作为饭店的核心人物,其诚信程度直接关系到饭店的前途与命运。因此,构建饭店职业经
在经济全球化的背景下,创业是促进经济增长的新动力。而只有在政府的大力支持下,创业之路才能更加顺利。因此,我们需要建立一个政府和企业有效沟通的机制,使得政策顺应新创企
<正>一、互联网档案的出现按照美国加州大学2003年的一项研究结果,2002年在互联网的各类网页中大约有92PB的信息,其中,在公众比较容易获得的表层网页中有167TB的信息。美国国