【摘 要】
:
主流神经网络训练的交叉熵准则是对声学数据的每个帧进行分类优化,而连续语音识别是以序列级转录准确性为性能度量。针对这个不同,构建基于序列级转录的端到端语音识别系统。
【基金项目】
:
国家自然科学基金重大研究计划资助项目(No.91538201);泰山学者工程专项经费资助(No.ts201511020)
论文部分内容阅读
主流神经网络训练的交叉熵准则是对声学数据的每个帧进行分类优化,而连续语音识别是以序列级转录准确性为性能度量。针对这个不同,构建基于序列级转录的端到端语音识别系统。针对低资源语料条件下系统性能不佳的问题,其中模型使用卷积神经网络对输入特征进行处理,选取最佳的网络结构,在时域和频域进行二维卷积,从而改善输入空间中因不同环境和说话人产生的小扰动影响。同时神经网络使用批量归一化技术来减少泛化误差,加速训练。基于大型的语言模型,优化解码过程中的超参数,提高模型建模效果。实验结果表明系统性能提升约24%,优于主流语音
其他文献
目的研究并分析光动力疗法与红蓝光治疗中、重度痤疮的疗效。方法将2014年2月~2015年12月我院收治的92例中、重度痤疮患者纳入到本组研究中,按照治疗方式的不同将92例患者分
康保二人台从最初的民间小戏,在不断的历史变革中,在时代艺术的要求下,逐渐的走上了产业化发展之路。康保二人台独树一帜的表演风格以及活泼有趣的艺术特征,都是在数代民间老艺人
甘薯高产稳产抗逆性强,营养丰富具有保健功能,劳动力密集耗水少,是入世后中国农产品参与国际竞争的强势作物.河北省甘薯生产具有生态、加工、区位三大优势,为省政府确定的五
目的探讨砷暴露对冶炼作业工人肝功能影响及肝脏B超的表现。方法对某冶炼厂2005~2014年砷作业现场监测、历年作业工人健康调查资料进行分析,将直接接触砷作业的冶炼工人作为
数字光处理(Digital Light Processing,DLP)打印技术是一种快速成型的增材技术,有成型速度快,打印精度高的优点。针对临床上用于骨损伤修复的人工骨植入物孔隙率低、无法随意设置孔洞的尺寸、孔洞间相互贯通率低、无个性化,导致的植入物医疗性能差,患者康复效果不佳的现状。本文基于DLP技术设计一款用于打印骨植入物的3D打印机,整个论文囊括如下内容:1)完成了DLP陶瓷骨支架3D打印机
盐酸多西环素(Doxycycline HCL)属于半合成四环素类广谱抗生素,具有毒性小、抗菌活性佳等优点,临床上用于革兰氏阳性菌、阴性菌和支原体等的感染。盐酸多西环素属于时间依赖
中国注册会计师行业党委2012年工作总结2012年,在中央领导同志的重视关怀下,在中央组织部、中央创先争优活动领导小组及其办公室、中央统战部、全国总工会、共青团中央等各有
在有关教育产品属性的问题上,存在着两条由强到弱或由弱到强的链条,即它的私人属性(本质属性)链条和权利属性(衍生属性)链条。从理论上厘清这两条链条,对教育产品的公正而合理的分配
冰球运动员的恢复主要依靠运动量的调整、理疗、按摩等,合理营养也是运动员取胜的重要因素之一,是运动员健康和运动能力的保证。营养对运动员的训练、机能状态、体力适应、恢复