基于隐马尔可夫模型的咳嗽识别技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jerryby001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
咳嗽是许多呼吸道疾病的一种常见症状,评估其强度及发生的频率可以提供宝贵的临床资料,为患者的诊断和治疗提供很大的帮助。至今这种对咳嗽的评估,主要依靠主观措施,如:咳嗽反射敏感性测试、患者对自身症状的感觉、咳嗽可视模拟测评、生活质量问卷、咳嗽症状描述和患者的日记等。鉴于人为的监测缓慢且乏味,容易受主观因素影响而出错,而患者对自身咳嗽特征进行描述未必完整、专业,研究智能的咳嗽监测系统及其算法显得非常必要。利用可靠的咳嗽检测算法减少大量需人工分析的数据,甚至可以做到去除人工分析的过程。 一个具有较高有效性的咳嗽识别系统,应能够识别出大部分在特定录音中的咳嗽声,同时又能够将它与其他的具有相似特性的声音区分开来。 文章在参考了国内外关于咳嗽识别的研究现状,并比较了咳嗽识别与语音识别的关系,提出使用隐马尔可夫模型作为咳嗽识别的主要算法。文章介绍人类发声的器官及其离散时域的发声模型,为后续的分析提供了基础。分析短时能量、短时过零率的原理及算法,介绍其区别有无声、清浊音的良好性能,并用这种分析方法证实了咳嗽声的发声特点,也为咳嗽声的端点检测打下基础。端点检测是把咳嗽声的起点与终点严格标记出来,为模型的训练与识别提供可靠的数据。文中采用了双门限比较法,并提出了二次提取。对于识别来说,特征提取是相当关键的,文章在介绍分析了线性预测编码倒谱系数及Mel频率倒谱系数的基础上,考虑到咳嗽的发声特征采用了短时能量+短时过零率+Mel频率倒谱系数+Mel频率倒谱系数一、二阶差分的结构来提取咳嗽的特征向量。另外文中还设计了一个咳嗽声录音装置,以解决录音上过饱和的问题。 最后介绍并推导出隐马尔可夫模型,利用隐马尔可夫模型对所获得的156个咳嗽声样本进行训练和测试性识别。结果显示,其正确率达78.95%。 这些结果表明隐马尔可夫模型可用于检测咳嗽声。
其他文献
当前,电子信息制造业已成为全球经济最重要的支柱产业,对经济发展、社会进步、人民生活和国防安全的影响越来越大。随着全球电子信息产业加快向中国产业转移的新趋势,给广州市电
自来水厂的混凝投药过程是一个复杂的物理化学反应过程,要对这个过程实现自动控制首先要解决的问题就是针对大时滞的控制研究。水厂沉淀池的纯滞后时间通常大约为60-120分钟,矾
随着通信网络技术和计算机网络技术日益发展和网络范围的扩大,网络变得越来越庞大而复杂。现代网络通常由不同厂家提供网络设备和软件异构而成,网络的运行、管理和操作维护成本
随着信息技术等现代科学技术的发展,邮件已经成为现在人们信息交流必不可少的一部分了。但是垃圾邮件也十分猖獗,并且垃圾邮件的种类也不断翻新。所以要采取更有效的反垃圾邮件
随着电子产品向微型化、便携式、网络化和多媒体方向迅速发展,SMT(SurfaceMount Technology表面贴装技术)在电子工业中得到越来越广泛的应用,并且在许多领域部分或全部取代了传
BACnet是由美国采暖、制冷和空调工程师协会(ASHRAE)制定的开放楼宇自动控制网络数据通信协议。它提出了一种标准的网络通信语言,使不同厂家生产的楼控设备能够互相通信、协调