论文部分内容阅读
咳嗽是许多呼吸道疾病的一种常见症状,评估其强度及发生的频率可以提供宝贵的临床资料,为患者的诊断和治疗提供很大的帮助。至今这种对咳嗽的评估,主要依靠主观措施,如:咳嗽反射敏感性测试、患者对自身症状的感觉、咳嗽可视模拟测评、生活质量问卷、咳嗽症状描述和患者的日记等。鉴于人为的监测缓慢且乏味,容易受主观因素影响而出错,而患者对自身咳嗽特征进行描述未必完整、专业,研究智能的咳嗽监测系统及其算法显得非常必要。利用可靠的咳嗽检测算法减少大量需人工分析的数据,甚至可以做到去除人工分析的过程。
一个具有较高有效性的咳嗽识别系统,应能够识别出大部分在特定录音中的咳嗽声,同时又能够将它与其他的具有相似特性的声音区分开来。
文章在参考了国内外关于咳嗽识别的研究现状,并比较了咳嗽识别与语音识别的关系,提出使用隐马尔可夫模型作为咳嗽识别的主要算法。文章介绍人类发声的器官及其离散时域的发声模型,为后续的分析提供了基础。分析短时能量、短时过零率的原理及算法,介绍其区别有无声、清浊音的良好性能,并用这种分析方法证实了咳嗽声的发声特点,也为咳嗽声的端点检测打下基础。端点检测是把咳嗽声的起点与终点严格标记出来,为模型的训练与识别提供可靠的数据。文中采用了双门限比较法,并提出了二次提取。对于识别来说,特征提取是相当关键的,文章在介绍分析了线性预测编码倒谱系数及Mel频率倒谱系数的基础上,考虑到咳嗽的发声特征采用了短时能量+短时过零率+Mel频率倒谱系数+Mel频率倒谱系数一、二阶差分的结构来提取咳嗽的特征向量。另外文中还设计了一个咳嗽声录音装置,以解决录音上过饱和的问题。
最后介绍并推导出隐马尔可夫模型,利用隐马尔可夫模型对所获得的156个咳嗽声样本进行训练和测试性识别。结果显示,其正确率达78.95%。
这些结果表明隐马尔可夫模型可用于检测咳嗽声。