基于高斯混合模型的咳嗽音检测研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:fantasyst
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
咳嗽是许多呼吸系统疾病中最常见的一种病症,当频繁、剧烈和持久的咳嗽出现时,通过进行咳嗽音分析,提取咳嗽的发生频率和强度能为患者病情的诊断和定量评估治疗效果提供重要的临床信息。但许多患者未能向医生完整、准确地描述自身的咳嗽特征,影响了病情的及时诊断与治疗。鉴于主观判断的不足,研究用于客观地测量及定量评估非固定个体的咳嗽频率,强度等特性的咳嗽音自动识别与分析系统,就显得非常必要。而如何有效地从一段含有背景噪音的咳嗽采集录音中检测出大部分咳嗽音,并实现咳嗽音与其它具有相似特性的声音的分离,是进行更深入研究的基础和关键。本文比较了咳嗽音检测与语音识别的关系,在对咳嗽音信号的特点进行研究的基础上,借鉴语音识别的相关技术,在MATLAB平台上搭建了基于高斯混合模型(GMM)的咳嗽音检测系统,并对小波分析理论在咳嗽音检测中的应用进行了研究。本文的主要内容如下:①在预处理方面,重点研究了基于小波变换的含噪咳嗽信号去噪方法,通过实验对小波函数和分解层数的确定、阈值的选择等关键技术进行分析研究,选取出合适的小波函数进行小波阈值去噪;然后采用基于短时能量和短时过零率的双门限检测算法对咳嗽信号进行端点检测。实验表明此方法提高了噪声环境下的咳嗽音检测系统的鲁棒性,同时减少了系统的运算量。②分析了音频特征提取领域中的三种主流特征参数:线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC),并对小波包变换技术进行研究,将其与MFCC参数相结合,提取了一个基于小波包变换和MFCC的参数(WPT-MFCC)。实验表明,相对于其它三种参数,WPT-MFCC参数能显著增强噪声环境下咳嗽音信号的检测效果。③研究了用于GMM模型参数估计的最大期望算法(EM)、分类模型库的建立方法和识别判决规则,在此基础上为采集录音中的咳嗽音、说话声、笑声、清喉音等数据各建立相应的GMM模型,并通过仿真实验分析研究了小波去噪、GMM阶数和不同特征参数对系统识别性能的影响,得出了一套较优的方案,提高了咳嗽音的识别率,降低了误判率。本文通过对基于GMM的咳嗽音检测系统的研究和仿真测试,为进一步开发具有实用性的咳嗽音识别与分析系统做了基础和探索性的工作。
其他文献
脑-机接口(Brain-Computer Interface, BCI)(?)将人的思维解读为一系列的外部控制命令,使人们可以不依赖神经肌肉通路而达到与外界交流的目的。脑-机接口的研究在康复工程领
随着IP网络逐步由单一的数据传送网向多媒体信息的综合传输网演化,用户的需求也由单一化的基本满足向多样化发展。由于组播的多点传输和多方协作应用特点,同时具有高效的数据
微博作为一种新型的社交媒体,其信息通过发布、评论、转发的形式进行传播,传播过程具有裂变性,因此,具有较快的传播速度和较广的传播范围,它的出现使得传统媒介黯然失色。研
随着网络技术的飞速发展,基于无线传输技术的移动自组网(Mobile Ad hoc Network简称MANET)开始崭露头角。移动自组网与传统无线网络的不同之处在于:移动自组网不需要任何固定
早期的公文流转系统都是通过“硬编码”的方式将业务流程定义程序写在系统中,这就需要对原系统进行重新设计来适应流程的变更,不仅会给企业带来难以承受的工作量,同时使得系
伴随着计算机技术的飞速发展,尤其是互联网技术的兴起和数据存储技术的提升,数据积累的速度越来越快,用户如何在有限的时间内得到有用的信息是目前计算机科学领域迫切解决的问题
组播是一种高效的通信模式,可以以较小的传输开销提供一点到多点和多点到多点的通信服务,因此可以广泛的应用于视频会议、在线直播、网络电视等领域,并在下一代IP网络中有着
随着世界人口的增长,人类对木材资源的需求也日益增加。木材资源作为一种可再生的自然资源,其可再生的能力已经无法满足人类日益增长的需要。如何有效地利用有限的木材资源,
车间调度问题是制造系统的关键,调度执行效率决定了制造系统能否按计划完成生产任务,高效完整的调度方法能够提高企业产品的质量和管理效率,缩短产品的生产周期,增强制造企业的综合实力。生产调度问题复杂多样,是一种典型的NP-hard组合优化问题,传统方法和已有的调度策略已无法满足实际生产中的各种需求。因此,不论在调度理论方面的学术研究,还是实际的制造业生产之中,探索有效的调度方案仍然是本领域研究的一个热点
传统的搜索引擎都是基于关键字来搜索的,所返回给用户的是一些包含关键字的网页的列表,而确切的答案还需要用户在这些相关网页中寻找。随着互联网的发展,信息成爆炸式增长,用