基于序贯高斯混合模型的语音活动检测

来源 :天津大学 | 被引量 : 0次 | 上传用户:a83312259
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音活动检测是一个将语音信号帧的序列或频率区间,通过在线方法划分为语音存在部分和语音缺失部分的二元分类器。它是声音信号处理领域的一个重要研究课题,是诸多语音信号处理系统的重要组成部分。通过语音活动检测对语音信号进行预处理,可以提升语音信号处理系统的后续处理效果。目前,语音活动检测的主要算法分为三类,分别是基于鲁棒性声学特征的检测算法、基于统计学模型的检测算法、以及基于深度学习技术的检测算法。其中,基于深度学习技术的检测算法在特定环境下能够得到最好的检测效果,但其具有计算负载大、需要额外储存空间、实用环境不匹配时效果不佳等缺点,因此无法完全代替基于统计学模型的检测算法。在统计学模型中,高斯混合模型被广泛用于描述语音信号和非语音信号的概率分布函数,之后采用似然函数对参数集进行估计,完成对带噪语音信号的分类。然而,传统的基于高斯混合模型的方法没有能够从理论上确保分类最优的算法框架,因此无法保证分类结果的最优化。本研究提出了一种基于最大似然准则的序贯高斯混合模型参数估计算法。该算法使用序贯高斯混合模型对每个频域子带上的语音对数能量谱建模,通过序贯似然函数对高斯混合模型的参数进行逐帧估计和更新。似然函数基于牛顿迭代法实现逐帧最大化,整个在线参数估计过程可视为一个一阶的时序回归过程。最后,语音信号的能量序列基于最大似然准则被归类为语音成分或非语音成分,并通过投票系统将所有子带的分类结果相结合,实现语音活动检测的功能。本文通过一系列实验结果证明了该算法的优越性。本文提出的算法不仅可应用于语音活动检测领域,还能够扩展到多种在线的分类器,从理论层面确保分类错误的最小化,具有广阔的科研价值和应用前景。
其他文献
目的探讨日间连续性静脉-静脉血液透析滤过(CVVHDF)对体外循环(CPB)下冠脉旁路移植术后ARF治疗疗效及时机选择。方法 CPB下冠脉旁路移植术后ARF进行日间CVVHDF患者20例分为A
进入夏季,又到了游玩水上活动的旺季。若以视觉吸引度来看,潜水无疑是最佳的选择。不少人以为潜水必须到外国去,才可以欣赏到美丽的海底世界。其实香港亦有不少的潜水“胜地”,而且让你足不出户就可以领略到潜水的乐趣,因为它们都是在网络上的哦~    注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文