论文部分内容阅读
近年来,随着人口老龄化问题日趋严重,就业压力逐步增大,使得越来越多的女性同胞走向工作岗位而不能有效地陪伴婴儿成长。但是,婴儿出生后的最先几个月内获得的安全感将伴随今后生活,因此及时满足宝宝需求会让孩子更健康地成长。目前主要由老人和保姆来代替父母看护的方式在理解宝宝需求,尤其是宝宝啼哭时的需求方面存在明显不足。在婴儿哭声情感需求信息领域中,绝大数的研究工作聚集在寻找婴儿在不同情感需求状态下的有效特征与寻找婴儿哭声中的不同情感需求信息识别模型上。但是,由于婴儿所处的环境并非绝对安静的环境,环境噪声将极大地降低婴儿哭声情感需求信息的识别率。因此,如何提高婴儿哭声中的不同情感需求信息识别模型的鲁棒性是一个亟待解决的问题。在现有研究的基础上,本课题拟在以下几个方面开展研究工作:(1)建立了婴儿在不同情感需求信息状态下的哭声语料库。语料是研究语音情感识别的基础,目前婴儿哭声情感需求信息语料在国内外上尚没有统一的语料库。针对这种情况,本文构建了婴儿哭声情感需求信息语料库。(2)研究了传统语音情感声学特征在婴儿哭声中不同情感需求信息识别模型中的抗噪鲁棒性。本文将韵律特征与相关谱特征相结合作为原始特征,分别研究了Softmax回归算法、人工神经网络和支持向量机三种方法的抗噪鲁棒性。实验结果表明,这三种识别模型虽然都具有一定的鲁棒性,但是效果不是很理想。(3)提出了基于改进的卷积神经网络来增强婴儿哭声中的不同情感需求信息识别的鲁棒性。本文在传统卷积神经网络的基础上,提出了基于多尺度卷积核与多池化方法的卷积神经网络来增强婴儿哭声中的不同情感需求信息识别的鲁棒性。实验表明,基于改进的卷积神经网络对于增强婴儿哭声中的不同情感需求信息识别的鲁棒性取得了良好的效果。(4)提出了基于Gabor灰度图谱多尺度块局部二值模式特征来提高婴儿哭声中的不同情感需求信息的鲁棒性。在传统的灰度图谱局部二值模式的基础上,首先生成语谱图灰度图像;其次,使用Gabor小波滤波;最后使用多尺度块局部二值模式对图像进行特征提取。实验表明,基于Gabor灰度图谱多尺度块局部二值模式特征对于增强婴儿哭声中不同情感需求信息识别的鲁棒性取得了良好的效果,与传统特征相比,其抗噪性能更好。