面向汉语儿向语音的检测算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lm198505050056
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着早期教育越来越受到重视,儿向语音这一婴幼儿最早接触的语言得到学者们的关注。由于儿向语音对早期儿童今后成长有着积极影响,如何正确的检测并加以利用是学者长期以来研究的方向。儿向语音检测是语音信号处理研究领域中重要的组成部分,通过提高儿向语音检测的正确率,可以运用在实际的移动设备中,改善成年人与婴幼儿之间的交互体验。当前,儿向语音端点检测技术有基于SVM分类器的儿向语音检测、基于隐马尔可夫模型的语音端点检测,使用SVM分类器对儿向语音特征进行学习,其训练过程中容易造成过拟合;使用隐马尔可夫模型,对语音信号的相关性提出了严格要求;儿向语音检测准确率的高低影响成年人与婴幼儿之间的交互体验。在汉语儿向语音预处理过程中,噪声信号的复杂性也极大影响后续汉语儿向语音检测的性能,通常使用端点检测算法对带噪信号降噪处理,而利用时域参数如:短时能量参数、短时平均过零率进行端点检测,在低信噪比环境下,检测性能大大降低;在某一特定噪声环境下,利用频域特征参数如谱熵能够提升端点检测的准确率,但是在多人讲话环境或背景音乐等噪声环境,其检测效果很不理想。因此,设计了一种基于Adaboost算法的汉语儿向语音检测模型,在测试集上进行检测,训练后的强分类器在准确率和正确率方面大大优于传统的检测算法,为后续的实时交互系统开发提供便利;并且Adaboost算法简单易用,不用对特征参数进行筛选;分类器训练过程中,不用担心过拟合。在汉语儿向语音检测的预处理过程中,进一步优化该过程,设计了一种基于改进谱熵的自适应端点检测算法。不同于常见的端点检测算法中采用的固定门限阈值,这里自适应门限阈值,使得该算法适应多类不同噪声环境下的端点检测。在不同信噪比环境下,通过对比基于谱熵的端点检测算法和本文改进的算法,整体上,后者在端点检测中的准确率有所上升;在低信噪比环境下,后者具有稳定的端点检测性能。
其他文献
碳纳米材料具有毒性低,易于合成和多样化的特点,并且能以多种形式存在。碳材料可以分为无机碳材料和有机碳材料两大类。无机碳材料分为石墨烯类材料如碳60、碳纳米管、石墨烯
随着社会经济的迅速发展,人们对能源的需求量不断增长,寻找一种清洁、安全、高效的可持续能源系统对整个社会的发展具有重要意义。氢能作为一种新型的可再生清洁能源备受人们
随着计算机技术的发展,存储系统的访存速度成为计算机系统的主要性能瓶颈之一。以相变存储器(Phase Change Memory,PCM)为代表的新型非易失内存的出现有望缓解这一矛盾,如何
石墨烯具有优异的力学、导电、导热等性能,通过与聚合物基体复合,可显著改善后者的导电、导热、力学、阻隔等性能,是实现聚合物高性能化和功能化的重要途径。然而,要实现这一
煤炭在我国能源结构中所占比重超过60%的现状将长期存在,减轻煤矿开采对自然环境的损害并充分回收有限的资源,是我国面临的一个巨大的挑战。以煤矸石为骨料的高强度膏体泵送
本文采用熔体接触反应法制备了Al-12Si基原位复合材料,通过改变原位反应体系工艺参数研究了铝硅合金中原位TiAl_3相的形成机制,讨论了向原位反应体系中添加合金元素B,对铝硅熔体中TiAl_3相合成机制的影响。通过改变基体合金中Si元素含量,分析其对原位TiAl_3合成机制的影响;并向基体合金中加入混合稀土,分析稀土对铝硅基复合材料中原位TiAl_3的合成机制的影响及TiAl_3形貌尺寸的变化原
无线传感器网络能量受限问题受到学者们广泛关注。层次路由协议采用分层策略减少节点能量消耗,靠近基站的传感器节点承受较大负载而快速消耗其能量导致这一区域的节点成片死
研究了2-噻吩硼酸和1-萘硼酸的合成方法,并通过高效液相色谱,红外光谱,核磁共振波谱对这两种硼酸进行了表征。重点对高效液相色谱的色谱条件进行了选择。采用格氏试剂法以2-
本研究选用4 mm厚LZ91双相镁锂合金,对其进行搅拌摩擦焊接(FSW)技术的研究,通过优化FSW工艺,建立工艺参数、表面成形及性能之间的关联关系,揭示LZ91镁锂合金在FSW过程中微观组织的变化规律。在工艺参数的优化过程发现,低转速(200 rpm、400 rpm和800 rpm)难以实现LZ91镁锂合金的FSW,而转速的提高(1200 rpm、1600 rpm和2000 rpm)有利于焊缝表面
岩石圈动力学过程与应力场分布密切相关。地壳断层区域应力环境的改变是导致地震破裂的重要因素。充分认识岩石圈应力场分布可以更好地理解板块运动驱动力、揭示应力场分布的