基于小波变换和GMM的病态嗓音特征提取及识别研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:zhoulei1964
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
病态嗓音识别是计算机技术在医学领域的渗透与发展,这将为临床实现无痛、无损伤化检查和客观的诊断作出重要的贡献。由于嗓音的复杂性,基于声学参数的病态嗓音检查不能仅凭一个或几个参数作出诊断,最终也无法摆脱医生的经验进行主观判断。为了真正实现客观的检测,许多研究者已经作了大量的工作,在病态嗓音的智能识别和客观评价方向上作出了重大的贡献,但目前的结果离真正的进入临床应用还存在一定的距离。本文在前人工作的基础上,研究了基于小波变换和高斯混合模型(GMM)的病态嗓音识别系统。从嗓音的发音机理、病态嗓音与正常嗓音在频域的表现差异,利用小波变换对信号进行分解,突出病态嗓音的特点,本文提出了基于多尺度分析的小波降噪、分解的熵系数(Entropy Coefficient Based on De-noise ,Decomposition of Multi-scale Analysis, ECDDMA)作为模型识别的特征矢量集,运用GMM模型实现了正常与病态嗓音识别。本文数据库242例正常嗓音和234例病态嗓音,其中病态嗓音样本全部来自临床,随机各选取80例作为训练集,剩余的作为测试集。详细介绍了小波变换和小波降噪的基本理论,并得到了ECDDMA系数的提取过程及算法。实验结果表明:ECDDMA系数较传统的模拟人耳听觉非线性特性的MFCC及其动态特征更有利于正常与病态嗓音的识别,并得到了好的识别结果。并通过实验分析了特征提取过程中去噪的必要性、模型混合数的选取对识别性能的影响、小波分解层数选取对识别性能的影响等问题。由于ECDDMA系数的提取是对语音的整个频域进行分析的,因此存在部分特征对识别率的提高没有作用,反而会使识别性能下降,使运算复杂,因此有必要进行特征选择,选出有效的特征来构建模型,提高识别性能。本文对传统穷举法与基于神经网络特征选择法进行了比较,实验表明基于穷举法的特征选择对于维数较多的特征矢量是不实用的,也证明了基于神经网络特征选择的优越性,本文最后使用神经网络方法从(ECDDMA系数+能量特征)22维原始特征中选取出了一组7维的特征矢量,并取得了较好的识别性能。对比分析了声学参数与ECDDMA系数病态嗓音识别性能,尝试了不同的特征组合特征选择后的识别性能,实验结果显示了ECDDMA系数较声学参数在计算机病态嗓音自动识别方面的优越性。
其他文献
IFN-γ主要由CD4+辅助T淋巴细胞,CD8+细胞毒性T细胞和自然杀伤细胞产生,具有抗病毒和免疫调节作用。IFN-γ可调节抗病毒蛋白的表达,使细胞处于抗病毒的状态;可活化巨噬细胞,
文章结合笔者多年工作经验,对事业单位档案管理存在的问题探讨提出了一些建议,仅供参考.
在科技水平提升背景下涌现的大量信息技术更好的支撑了档案管理工作开展,但值得注意的是,因一些主客观因素等影响,档案管理工作有效性并未充分发挥.大数据时代的全面到来,要
随着经济水平的提高以及科学技术的飞速发展,人们对于生活和工作环境安全性的要求也越来越高,视频监控系统可以直观、便捷的向人们反馈实时环境信息且信息内容丰富,在很多领域受
市场经济环境下,医院与外界的工作联系更加的紧密,这不仅是医院有效迎合市场发展的需求而开展的一项工作,更是新时期医患关系和谐,医院品牌形象建设,人才对接,医疗技术升级发
意识形态工作在国有企业管理当中占有着十分重要的地位,尤其是进入新时代后,开展意识形态工作仍然面临着很多考验.如何认识存在的诸多问题,如何解决和应对,是一项重要的课题.
粘孢子虫(Myxozoa)是一类主要寄生于鱼体的重要寄生虫,能导致鱼类的严重病害,粘孢子虫病的诊断和流行病学调查尤为重要。本论文从形态、组织病理、分子水平研究了几种粘孢子虫
在工程材料力学中,变形后的梁弯曲轴线称为挠曲轴线,简称挠曲线。它反映了材料的力学性质,是研究材料特性的重要参数。对梁挠曲线测量研究时,由于弯曲度小,无法用常规的方法
杓兰亚科是兰科的一个单系类群,广泛分布于欧亚大陆和美洲的温带至热带地区。由于其具有拖鞋状的唇瓣,通常将杓兰亚科植物总称为拖鞋兰(Ladysslipperorchid)。该亚科植物具有两
机动目标跟踪是当今国际上目标跟踪研究的热点和难点。目标跟踪的目的是利用探测器所获得的运动目标量测,完成对目标运动状态的估计。目标跟踪过程也是一个降噪的过程,因为量