论文部分内容阅读
随着人口老龄化的日趋严重、以及心脑血管疾病的年轻化,使得越来越多人丧失行动能力,加上护理人员的缺乏,社会需要加速研发更为智能的护理床。护理床采用语音控制来取代单纯的按钮控制,能够为失能患者带来很大的方便。然而,在养老院以及医院,通常都会有多张护理床处在同一室内,环境相对嘈杂,若是多人同时发送语音命令则容易相互干扰。如果采用非特定人语音控制系统,那么任何人都能够对护理床发送语音命令,将对患者的安全产生严重影响,有可能导致患者二次伤害,这制约着护理床的推广应用。针对这个问题,本文基于Android平台,开发了一套融合了声纹识别的护理床语音控制系统。首先,本文综述了课题的背景知识、研究意义,并介绍了护理床的研发现状,分析了声纹识别以及语音识别的研究现状。本文指出了,尽管语音信号的处理识别技术发展至今已经相当成熟了,然而在目前市场上,能够针对特定患者的声纹特征进行语音识别的护理床控制系统还是缺乏。其次,本文基于用户体验原则,对护理床语音控制系统的需求作了分析,对各种开发平台进行了比对,选择了Android开发平台,然后进行语音控制系统的概要设计。第三,本文探讨常见的音频格式的特点,在Android上采用WAV格式做语音特征提取。然后分析了提取音频文件的数据,并对它做预处理,研究了确定其参数的方法。紧接着是对语音数据进行MFCC特征提取。接着,解决了在Android上编程时,遇到NaN数据的问题,实现在Android平台上的MFCC特征提取。第四,深入探讨了声纹识别以及语音识别的各种算法基础上,选择了GMM作为声纹识别的算法,并在Matlab上做实验进行验证,以及选择HMM和DTW进行Matlab对比实验,实验样本采用个人录制的语音所提取的MFCC特征。实验也证明了,在合理设置阈值的前提下,GMM适合作为控制系统的声纹识别算法,用于屏蔽非护理床用户的语音。也证明了在少量训练样本、识别对象为孤立词的情况下,采用DTW识别效果以及识别时问都优于采用HMM。而后,在Android平台上实现了基于GMM的声纹识别和基于DTW的语音识别。第五,本文根据概要设计、界面设计和流程设计,详细阐述了在Android平台上设计护理床语音控制系统的过程。然后,对语音控制系统进行性能试验。设置阈值后,当声纹识别的召回率为72.5%时,非护理床用户的语音有1.25%的可能致护理床动作。通过了声纹识别后,指定护理床用户的语音识别率为97.13%,而非指定护理床用户的语音识别率为14.29%。指定护理床用户从读入语音到护理床产生动作的过程,需要时间1-2秒。最后,对本课题的工作作了总结和展望,并提出了课题今后应该努力的方向。