面向老年人语音与面部表情的情感识别研究

来源 :安徽建筑大学 | 被引量 : 0次 | 上传用户:syw2565
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感计算是为了赋予计算机识别、理解、表达和适应人类情感的能力,以此实现高效、亲切的人机交互。人类情感有着表情、语音、生理信号等多种载体,进行多种模态的情感识别研究可以促进情感计算的发展。本文从老年人的多模态情感库的建立、语音情感特征提取方法、人脸表情特征提取方法以及情感识别结果等方面展开研究。其主要研究工作及成果总结如下:1.针对目前老年人情感领域研究的缺乏以及情感数据库模态单一的现状,本文在名为《空巢姥爷》的电视连续剧上构建了视频情感数据库、语音情感语料库和人脸表情图像库,并阐述了三种情感库的构建方法和过程。实验结果表明,多模态情感数据库的构建是合理的和有效的。2.针对常用的语音特征的情感识别率不高的问题,本文提出了六层小波包系数模型的老年人的语音特征提取及情感识别方法。分别提取6层小波包系数特征(Wavelet Packet Coefficients,WPC)、动态特征(一阶差分和二阶差分)以及全局特征(最大值、最小值、平均值、中值和方差)共计5760个特征参数。采用主成分分析方法进行特征降维,并选择支持向量机作为分类器。通过与梅尔倒谱系数(Mel-Frequency Cepstral Coefficients,MFCC)和傅里叶系数(Fourier parameter,FP)比较。实验结果表明,WPC特征模型的语音情感识别率相对于MFCC和FP是更高的,WPC+MFCC特征集也是融合后的特征集里识别率最高的。说明本文提出的方法是有效的。3.针对老年人的人脸表情识别研究不多的情况,本文提出了二维Gabor滤波器模型的老年人的人脸表情特征提取及情感识别方法。本文在空巢姥爷人脸图像库的基础上,使用二维Gabor滤波器精确地提取人脸图像的局部特征。本文使用了具有5个不同尺度和8个不同方向的40个滤波器与图像进行卷积运算,得到图像在不同位置、尺度和方向上的特征。由于提取的图像特征维度较高,需要进行特征降维,本文提出的降维方法是:在滤波之前,先缩减图像尺寸和减少像素个数。然后在滤波过程中,强制抽取部分特征。此方法大大降低了特征维度,而且通过后期实验证明,并没有丢失关键的表情信息,表情依然可以得到较好的分类。最后,本文采用的分类器是多决策神经网络的方法,类似于Adaboost分类的多专家决策思想,并试图让分类器输出多个决策。实验结果表明,本文的方法对于老年人的面部表情识别是有效的,拥有一定的研究价值。
其他文献
慢性盆腔炎是妇科常见病、多发病。常为急性盆腔炎未能彻底治疗或患者体质较差病程迁延所致,但亦可无急性盆腔炎病史,如沙眼衣原体、解脲支原体感染所致输卵管炎。部分慢性盆
在文献回顾的基础上构建概念模型,研究了企业社会责任对顾客信任的影响机制。应用经过信度、效度检验的量表对研究变量进行测量,通过结构方程模型对研究假设进行检验。结果表明
讨论精神病患者性防卫能力司法鉴定中的几个问题。
文化景观一词,二十世纪二十年代起已普遍应用。它是人类在地表活动的产物,是自然风光、田野、建筑、村落、厂矿、城市、交通工具和道路以及人物和服饰等所构成的文化现象的复
李德裕虽出身门荫,但其主政时并非刻意排斥进士,更多的是对进士科的积弊进行整肃,从而规范其作为仕途经济的功效。而其政敌实际上却大有助长积弊之嫌。因此,将进士科作为泾渭党争
声乐作为一门表演艺术,有其特殊的表现形式。出色的演唱技巧与完美的艺术表现相结合的表演是声乐表演艺术的最高境界。在声乐教学过程中,演唱技巧的学习和艺术表现力的培养应
M2/GDP比例的不断走高是中国市场化改革以来出现的一种特有经济现象。为了能够对这种经济现象做出较为合理的解释,本文利用弗里德曼所提供的货币理论分析框架以及麦金农的理
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
我们以普通法学与历史学的观点,重新检讨中国古代社会经济的性质,认为它是一个古代的市场经济,具有相当程度的社会分工以及相当自由的市场活动,起码在有信史可据的这些朝代是如此
胶带接头的强度是整条胶带中最薄弱的环节,也是胶带在使用维修中的重点。如何学会和掌握胶带接头的硫化粘接工艺,是用户最关心的一个问题。从前胶带接头均用金属扣连接法,但