【摘 要】
:
声学模型在语音识别系统中处于核心的地位。对维吾尔语而言,由于数据采集和标注存在的各种困难,用于训练声学模型的语音数据不够充分。为此,本文研究了基于长短期记忆网络的
【机 构】
:
新疆大学信息科学与工程学院; 科大讯飞研究院;
【基金项目】
:
国家自然科学基金(No.61363063,No.U1603262);新疆自治区重点实验室项目(2015KL013)
论文部分内容阅读
声学模型在语音识别系统中处于核心的地位。对维吾尔语而言,由于数据采集和标注存在的各种困难,用于训练声学模型的语音数据不够充分。为此,本文研究了基于长短期记忆网络的跨语言声学模型建模方法,利用汉语庞大的训练数据训练深度神经网络声学模型,然后将网络的输出层权重去掉,用随机化的方式产生与维吾尔语输出层对应的权重值,然后采用反向传播的方式,利用维吾尔语语音数据更新所有权重来训练维吾尔语声学模型。实验结果表明,本文提出的方法使维吾尔语转写和听写识别系统的识别错误率比基线系统平均分别相对减少了20%和30%,说明该方法利用了汉语大数据来训练神经网络的隐层,让维吾尔语声学模型能在一个较好的初始权重网络上进行训练,增强了网络的鲁棒性。
其他文献
采用种群累积培养法,研究了藻类食物的种类和密度对萼花臂尾轮虫休眠卵形成的影响。结果表明,萼花臂尾轮虫的休眠卵主要在开始培养后的6天内形成。在0.1mg/ml的食物密度下,与蛋白核小球藻
湘西合仁坪钠长石-石英脉型金矿中,角砾岩普遍发育,主要分布于矿脉中,与金成矿关系密切。在详细的野外观察和室内研究的基础上,文章对合仁坪金矿床中角砾岩的形态、大小及胶
多模态话语分析理论与现代语言教学紧密相关、相互促进。多模态话语媒体系统可以作为新的视角,来探讨多种模态在大学英语口语教学实践中的具体应用。多模态在口语中的应用可以
目的研究护理干预对宫外孕患者临床治疗效果的影响。方法从本院2015年1月至2017年1月接受的宫外孕腹腔镜治疗患者中,抽取106例,随机分为对照组与观察组,对照组实施常规护理,
宗教文化遗产作为一种人文资源,是青岛城市发展特色之一.具有延续城市文脉,丰富城市 文化内涵,推动文化产业升级等重要的现实意义.目前,缺少合理的管理制度条例,缺乏足够的重
调研发现自由裁量权的存在、刑事立法的不完备、程序设置上的缺陷、社会环境的干扰等均是造成量刑失衡现象的诱因。实践中量刑偏差现象,容易造成公众“以钱买刑”的错误认识、
橄榄石是地幔中的主要造岩矿物,橄榄石到其高压相的相变对地幔动力学过程有着广泛的影响.人们通常认为地幔成分中橄榄石的α-β相变是产生410km间断面的原因,并认为橄榄石的
造船业直接间接拉动国民经济几乎所有行业,丹东发展大型造船业对丹东港、丹东地区乃至辽宁经济意义深远。分析了国内外造船市场态势,指出船舶业是发展中国家经济强国的支柱产业
本文阐述了西班牙华侨华人协会和华侨华人妇女联合会,为弘扬中华文化,培育海外精英,创办马德里中文学校的艰难历程及其办学的基本经验。
为充分提升重型牵引车辆通过不良路面的能力,对国内某款重型牵引车在传统结构的基础上加装了前轴液压轮毂马达辅助驱动系统,并针对该混合动力系统,开发了工程化的控制策略,实