基于深度学习的东干语语音识别的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:yumeng88888888888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,人工智能技术正在快速发展,越来越多的研究者将智能语音技术(语音识别、语音合成、对话、翻译等)应用于语种保护、语音交流以及语音搜索等领域,尤其是民族语言的保护。其中,语音识别技术是利用语言学、语音学、模式识别等学科将语音转换为文本的过程,是实现人机交互的关键技术之一。语音识别技术在飞跃进步,除普通话、英语等主流语言的语音识别的研究,方言和民族语言的语音识别也成为研究热点。东干语是中亚东干族所使用的语言,是汉语陕甘方言的特殊变体,有甘肃方言和陕西方言之分。本文研究了东干语陕西方言的语音识别方法,实现了基于传统HMM、深度神经网络(Deep Neural Network,DNN)、卷积神经网络(Convolutional Neural Network,CNN)、DNN混合语料以及端到端(End-to-End)方法的东干语语音识别。实验结果表明,在HMM、DNN、CNN以及混合语料DNN的对比实验中,混合汉语/东干语语料训练的DNN声学模型取得的词错率最低为14.59%,而在几组端到端实验中识别率最高的为混合CTC/Attention架构在CTC解码权重为0.2时取得最好的识别率为66.1%。本文主要工作和创新如下:1.建立了东干语语料库。通过研究东干语发音特点,设计了覆盖所有音节的4000句东干语文本语料,语音语料的录制是在校东干族留学生在专业录音棚中录制。同时根据东干语发音规则完成东干语的标注。2.实现了基于传统HMM和DNN、CNN东干语语音识别的对比实验。分别训练了东干语HMM、DNN、CNN声学模型,对东干语文本语料训练获得到3-gram语言模型,设计了东干语发音词典,实现了上述三种方法下的东干语语音识别。实验结果表明,在相同的环境下,DNN东干语语音识别相对于传统HMM识别率从84.41%提升到84.87%。同时,由于CNN强大的学习能力,词错率相对于DNN又下降了0.17%。3.实现了混合语料DNN声学模型东干语语音识别。考虑到低资源语料训练模型时会因为数据稀疏而出现训练的模型参数不精确,我们选择了汉语辅助建模训练。实验将30小时的汉语语料和4000句东干语语料混合训练了混合声学模型和语言模型。实验结果表明,通过其他语言辅助训练模型参数能有效提高目标语言的语音识别率。4.实现了End-to-End的东干语语音识别。本文训练了长短时记忆网络(Long Short-Term Memory,LSTM)和双向长短时记忆网络(Bidirectional Long-Short-TermMemory,BLSTM)两种编码网络,实现了基于链接时序分类(Connectionist Temporal Classification,CTC)、注意力(Attention)和混合CTC/Attention三种方法下的东干语语音识别,并对实验结果进行了对比分析。
其他文献
文章通过对蒸压釜制造和使用过程的详细了解,并结合有限元应力分析方法对釜体法兰釜齿进行了线性化应力校核,得出了蒸压釜釜体法兰齿根部裂纹产生的原因,并给出了维修技术方案,为
本文分析了胜利二号钻井平台技术改造前后的总体性能特点与各类稳性变化和改造内容的关系,探索了大型平台在改造中总体性能方面的问题。
我国移动数字阅读具有巨大的市场需求和广阔的服务拓展空间,众多的数字内容提供商、移动服务运营商、终端设备制造商等已纷纷涉足移动数字阅读领域。文章分析了我国移动数字阅
在我国,年税收收入的90%以上来自企业。因此企业作为最主要的纳税人,必须重视税收因素对经营成果的影响,恰当的运用税收筹划。所谓税收筹划,就是在既定的税收和税制框架内,通过实现
立足于中国认罪案件律师参与“案多人少”的矛盾,在反思域外律师参与认罪案件模式的差异、差异产生的原因以及存在的问题的基础上,一方面需要加强法律服务人员队伍的建设,为
青藏高原高寒牧区气候寒冷,作物生长季短,牧草资源极其短缺。小黑麦和黑麦抗寒性强,高产优质,耐贫瘠,能够较好地适应该区的气候条件,对种子的需求量越来越大。但小黑麦和黑麦
通过北极政策的发表,中国政府表明了积极参与北极治理、共同应对全球性挑战的立场、 政策和责任.它体现了“人类命运共同体”的治理理念.中国的北极政策目标和基本原则主要
民为国基,谷为民命。粮食事关国运民生,粮食安全是国家安全的重要基础。YL粮食集团公司是河南省的大型国有粮食企业,主要从事粮食仓储、粮食购销和粮油深加工等业务,承担着河
学界的研究和条约法的实践表明,对于国际法是否具有体系、是否存在位阶,以及《维也纳条约法公约》第31.3条(c)项的含义、作用等问题,尚存较大分歧。由于国际法的体系化与碎片
科技型中小企业的价值评估实务中会遇到两大难点,一是创新驱动企业价值增长的过程存在巨大不确定性,二是相对缺少有针对性的评估理论、方法和模型,这两者导致难以合理、准确