【摘 要】
:
当前语音识别技术发展迅速,运用广泛,但针对云南少数民族语言的语音识别研究工作较少,现有研究成果主要是基于传统语音学的方法。语音识别研究总的来说主要基于语音信号和语
论文部分内容阅读
当前语音识别技术发展迅速,运用广泛,但针对云南少数民族语言的语音识别研究工作较少,现有研究成果主要是基于传统语音学的方法。语音识别研究总的来说主要基于语音信号和语谱图两个方面开展工作,语谱图是语音信号的所有特征的图像形式,语谱图识别无需考虑语音本身的清浊音等语音特征因素。残差网络是图像领域的一种主流模型,这种网络范式解决了网络的退化问题。本文提出了基于残差网络的佤语语音识别研究方法,对卷积神经网络及残差模块的相关理论进行了深入的研究,最终得到一种有效的佤语语谱图分类方法。主要的研究工作及成果如下:1)研究残差网络相关理论,分析其结构特点,对恒等残差块和卷积残差块做改进,搭建一个46层的残差网络模型(ResNet46s),通过实验校验各参数对实验结果的影响,从而确定模型的参数。选择Keras平台提供的ResNet50和InceptionV3、InceptionResNetV2三种算法,通过最终的对比实验发现,基于ResNet46s的佤语孤立词语谱图识别率高于其他模型,且收敛速度更快,其识别率达96.3%.2)开展孤立词语音合成连续语音的算法研究。针对佤语孤立词语音语料,根据语音信号特征提出算法(wavmerge),本文最终得到4000条佤语连续语音语料。3)开展小规模连续语音语谱图样本的佤语识别研究。对合成的每条佤语连续语音加入5种不同的噪声,通过最终的实验结果发现,基于ResNet46s网络的连续语音语谱图识别率达90.2%,证明所搭建模型系统具有良好的鲁棒性。
其他文献
在地表物理流体质量再分布的作用下,GPS测站的位置受到大气负载、非潮汐海洋负载以及水文负载等地球物理效应的影响,这些因素都可能使测站发生非线性运动,为了研究毫米级的构
城市路网发生交通事故、车辆抛锚和货物洒落等交通事件之后,往往会形成道路通行能力的瓶颈,产生车辆拥挤排队现象,形成偶发性交通拥堵。如果交通事件不能得到及时有效的处理,
混沌系统参数估计是混沌系统同步与控制的基础性问题,通过构造适应度函数可以将它抽象为连续多维优化问题,并通过启发式算法求解.飞鼠搜索算法(SSA)是一种新型启发式优化算法
近年来动态场景中的目标跟踪在计算机视觉中意义重大,此外,在机器人智能技术和监控智能技术等诸多应用中具有重要意义。由于目标在运动过程中存在位置,姿态,尺度的变化以及遮
肿瘤作为威胁人类健康的最主要疾病之一,其高效、精准诊疗引起了科研工作者的广泛关注。发展新型多功能诊疗试剂是实现肿瘤有效治疗的关键。共轭聚合物(conjugated polymers,
被动锁模光纤激光器具有体积简洁紧凑、抗干扰性强、光束质量优良等优点,在高性能光纤传感、高精度光谱测量分析、高精度精密加工、激光医疗、高容量光纤通信、激光医疗器械
金融自由化是当前经济发展的一个重要趋势,其中最核心的一个内容就是利率市场化。而我国目前一个重要的任务是深化金融体制改革,实现市场在资源配置中起到最优的作用,从而促
近年来,随着人工智能化的广泛应用,医疗信息化和自动化也逐渐引起了广泛关注。在医疗健康领域,药品说明书相对于公开医疗领域文本,书写良好、权威、全面,虽然数据规模较小,但
单位面积上所承受的空气柱的质量被称为大气压力。在现代气象科学中,精确的气压资料是进行精确天气分析和预报的关键,大气压力是气象学中一个极其重要的物理参量,开展大气压
随着社会的发展,国际交流日益频繁,英语作为一种国际交际用语也扮演者愈来愈重要的角色。在英语的学习过程中,听说读写是学习英语的四项基本技能。在初中英语教学过程中发现,