山西大同地方方言语音识别技术及应用研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:RubbishHP
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大同市地处山西省最北部,其地方方言是晋语的重要组成部分,该地区的语言特点相比于晋中和晋南的方言复杂度更低。对该区域方言的语音识别的研究可以为山西地方方言语音识别技术的研究奠定良好的技术基础。本文首先介绍了大同方言的语言特点及大同方言语音数据集的构建过程,语音数据集将应用于大同方言语音识别模型的训练。大同方言与普通话在语法、发音等方面有着较大的差异,相比于普通话多出了“入声”声调。因入声发音短促,一发即收,音频的持续时间更短,所以入声特征在语谱图中的频谱范围更小,使得语音的频谱表示更为复杂,针对这一问题,结合卷积神经网络的结构特性,本文提出了一种“多核卷积融合网络(MCFN)”来提取语谱图中不同持续时长的音素特征,该结构可附加于声学模型之前,增强声学模型的鲁棒性。此外,本文还结合注意力机制构建了端到端的大同方言语音翻译模型,该模型把大同方言与普通话视为两种不同的语言,通过将大同方言的语音信号特征输入至端到端的语音翻译模型并映射成高维度的特征,再与中文普通话文本形成对应关系,输出结果,该模型可直接使方言语音与普通话文本建立联系,无需方言文本作为过渡,减少了方言文本的质量问题给模型带来的消极影响。MCFN与端到端的语音翻译模型协同工作,可完成大同方言语音转普通话文本的任务,实验证明效果良好。对大同方言语音识别技术的研究不仅可以拓宽语音识别用户群体,方便那些口音严重的用户进行人机交互的活动,还可以应用于身份认证和医疗辅助诊断等领域。此外,本课题对保护山西地方方言这一非物质文化遗产、增进全国无障碍语言交流有重要意义。
其他文献
合理规则作为美国反托拉斯法适用的一种基本方法,其产生问题一直是我国学界争论的议题。本文从帕克规则在英国法上贸易限制合同案件的最早适用情况入手分析,比较了帕克规则与
啤酒中的氧包括溶解在啤酒中的氧和瓶颈空气中的氧,1mL瓶颈空气相当于300ppb溶解氧,所以降低瓶颈空气尤其重要。08年5月上旬,公司调整质量指标控制标准,把以前的瓶颈空气含量标准
随着时间、内外部环境和需求等众多不确定因素的影响,企业的原有生产计划渐渐不适应于现状,需要进行生产调度研究来优化丰富原本的计划方案。为了减少采购、运输和时间等一系
我国进入“经济新常态”以来,供给侧结构性改革成为政府工作的主线,中国人民银行也在原有货币政策工具的基础上进行探索和创新,创设了一系列结构性货币政策工具,以期达到总量
6月30日,南对外经贸大学国际经济研究院主办、《太平洋学报》编辑部合办的“‘一带一路’背景下的砸太经济合作研讨会”在对外经贸大学举行。来自中国人民大学、商务部、中国
无刷双馈发电机(BDFG)因其具有结构简单、功率因数可调、变频器容量小等优点而备受关注。本文以无刷双馈发电机在柴油发电机组中的应用为背景,分别对无刷双馈发电机和永磁同
用Logistic模型计算公司违约概率在实际应用中存在两个问题:一是在缺乏公司违约记录数据库或违约记录数据库不典型的情况下,无法应用该模型或模型计算结果不准确;二是现有Log
国家海洋局东海分局成立于1965年3月18日,是国家海洋局派驻东海区的海洋行政管理机构。履行北起江苏连云港南至福建东山诏安头我国管辖海域的有关海洋监督管理职责。
通过在上海世茂深坑酒店项目的施工安全管理中应用BIM技术,有效地克服了该项目结构形式复杂、钢结构施工难度大等多项施工难题,实现了对安全方案策划、危险源辨识、安全防护的
2009年9月,日本民主党竞选胜出并开始了执政之路。民主党的执政,打破了自民党长期一党执政的局面。这一重大变化,使日本政党体制的复杂性逐步显现,日本具体是朝两党制、多党制发