论文部分内容阅读
咳嗽是许多呼吸道疾病的一种常见症状,咳嗽特征的改变将为呼吸道疾病病理机制的研究提供重要的线索。不同组织结构的特性,能产生不同模式的咳嗽,因而咳嗽的不同模式能揭示咳嗽的不同病理机制。评估其强度及发生的频率可以提供宝贵的临床资料,为患者的诊断和治疗提供很大的帮助。至今这种对咳嗽的评估,主要依靠主观措施,如:咳嗽反射敏感性测试、咳嗽可视模拟测评、生活质量问卷、咳嗽症状描述和患者的日记等。鉴于人为的监测及处理缓慢且乏味,容易受主观因素影响而出错,而患者对自身咳嗽特征进行描述未必完整、专业,研究智能的咳嗽监测系统及其算法非常必要。为了实现一个实用的,面向用户的咳嗽识别系统,基于咳嗽的声学特性,本文对连续无限制语音流中咳嗽信号的识别进行了研究。实际环境中,连续无限制语音流中没有完全纯净的咳嗽信号,往往都伴有语音或其他干扰,如何在连续无限制语音流中高效地标识咳嗽信号,即找到咳嗽信号的起止点,且具有较高的识别率和较好的鲁棒性是本文工作的重点。文章参考了国内外咳嗽识别的研究现状,比较了咳嗽识别与关键词识别的关系,对咳嗽信号的产生机制和咳嗽信号的特点进行了研究。利用过零率来定位可疑咳嗽,从而确定能量阈值。在此基础上,将短时能量和过零率用于连续语音流中咳嗽信号的端点检测,具有较好的鲁棒性。端点检测考虑到效率,通常不能将干扰滤除干净,这就需要对咳嗽和干扰进行分类。本文引入隐马可夫模型,分别建立干扰模板和咳嗽模板,取得了较好的效果,同时,对基于统计模型的系统而言,样本数据库管理在模型训练和系统性能的提高方面发挥着至关重要的作用,本文着重讨论了样本数据库的构建和管理。基于以上研究成果,本文在vs2008平台上,实现了连续无限制语音流中咳嗽信号的识别系统,它将能反映病人病情的发展状况,及时帮助医生了解治疗的进展,在此基础上,可进一步开发咳嗽诊断系统,推进医疗系统信息化建设。使用程序对12名病人在病房环境下的样本进行测试,得到识别结果,并将结果与医生人工判断结果相比较,得到:对于咳嗽信号,使用端点检测算法,漏检率为3.09%,插入率为44.7%,使用隐马尔可夫模型作为识别算法,识别率为96%,误判率为6.2%。