论文部分内容阅读
咳嗽是许多呼吸系统疾病中最常见的一种病症,当频繁、剧烈和持久的咳嗽出现时,通过进行咳嗽音分析,提取咳嗽的发生频率和强度能为患者病情的诊断和定量评估治疗效果提供重要的临床信息。但许多患者未能向医生完整、准确地描述自身的咳嗽特征,影响了病情的及时诊断与治疗。鉴于主观判断的不足,研究用于客观地测量及定量评估非固定个体的咳嗽频率,强度等特性的咳嗽音自动识别与分析系统,就显得非常必要。而如何有效地从一段含有背景噪音的咳嗽采集录音中检测出大部分咳嗽音,并实现咳嗽音与其它具有相似特性的声音的分离,是进行更深入研究的基础和关键。本文比较了咳嗽音检测与语音识别的关系,在对咳嗽音信号的特点进行研究的基础上,借鉴语音识别的相关技术,在MATLAB平台上搭建了基于高斯混合模型(GMM)的咳嗽音检测系统,并对小波分析理论在咳嗽音检测中的应用进行了研究。本文的主要内容如下:①在预处理方面,重点研究了基于小波变换的含噪咳嗽信号去噪方法,通过实验对小波函数和分解层数的确定、阈值的选择等关键技术进行分析研究,选取出合适的小波函数进行小波阈值去噪;然后采用基于短时能量和短时过零率的双门限检测算法对咳嗽信号进行端点检测。实验表明此方法提高了噪声环境下的咳嗽音检测系统的鲁棒性,同时减少了系统的运算量。②分析了音频特征提取领域中的三种主流特征参数:线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC),并对小波包变换技术进行研究,将其与MFCC参数相结合,提取了一个基于小波包变换和MFCC的参数(WPT-MFCC)。实验表明,相对于其它三种参数,WPT-MFCC参数能显著增强噪声环境下咳嗽音信号的检测效果。③研究了用于GMM模型参数估计的最大期望算法(EM)、分类模型库的建立方法和识别判决规则,在此基础上为采集录音中的咳嗽音、说话声、笑声、清喉音等数据各建立相应的GMM模型,并通过仿真实验分析研究了小波去噪、GMM阶数和不同特征参数对系统识别性能的影响,得出了一套较优的方案,提高了咳嗽音的识别率,降低了误判率。本文通过对基于GMM的咳嗽音检测系统的研究和仿真测试,为进一步开发具有实用性的咳嗽音识别与分析系统做了基础和探索性的工作。