论文部分内容阅读
喉部疾病可以对病人嗓音产生不同程度影响,因此可以通过嗓音识别技术对这类疾病进行辅助诊断治疗。特征提取是病态嗓音识别中的关键技术,所提取特征的有效性直接影响到模式识别的分类结果。由于发声系统的复杂性,目前基于声学特征参数的病态嗓音识别尽管取得了一定的进展,但识别率仍然不能满足临床实时识别的要求。因此提取更有效的病态嗓音特征,继续提高病态嗓音分类精度,一直是相关工作关注的焦点。本文主要对病态嗓音特征提取技术进行了相关研究,主要包括如下两个方面内容:1、为了探索传统声学特征和非线性特征对病态嗓+音识别的贡献情况,本文采用了基于BP神经网络的特征排序方法对20种常用的特征参数进行了特征显著性度量排序。该方法根据每个输入特征的显著性度量值,以判断各特征对病态嗓音识别的贡献。最后,本文根据这些特征的显著性度量值,选择对识别贡献最大的前几种特征作为特征矢量集,使用支持向量机(SVM)进行识别,得到最高识别率为98.67%,平均识别率为88.66%。2、为进一步提高正常与病态嗓音分类的正确率和识别过程的鲁棒性,本文在基于嗓音产生机制的原理上提出了使用小波技术对嗓音信号进行预处理后再进行特征提取的方法,有效地提高了平均识别率。通过分析嗓音的产生机制可知,嗓音疾病主要集中发生于声带附近,因此该方法是通过去除嗓音中的声道响应信息,实现识别率的提高。其中通过使用二进离散小波变换技术实现了对模糊熵、频率微扰、2阶Renyi熵等特征识别率的提高,尤其是2阶Renyi熵,最高识别率由89.33%提升至97.33%,平均识别率由79.19%提升至91.32%。由于二进离散小波变换对高频信号分解不够精细,为此本文还提出了使用小波包变换替换二进离散小波变换的方法。通过使用小波包变换技术实现了对各非线性特征识别率的提高以及各特征组合识别率的提高,最后在使用Hurst参数+计盒维数作为特征矢量集时得到了最佳识别率,最高识别率为98.67%,平均识别率为93.92%。