基于时空特征的双模态情感识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:lwzeta
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感的理解和表达是人类进行交流活动的重要手段。随着人工智能等领域的快速发展,智能化的人机交互需要满足用户与机器之间的“自然”交互,而达到“自然”交互的关键是让机器具有模拟人类情感认知和表达的能力。作为情感表达最直观外在形式的视觉情感信息,在情感识别研究中具有重要的研究意义。本文从视觉情感信息入手,融合面部表情和上身姿态特征实现双模态情感识别。本文的主要研究内容和创新点如下:(1)视频是由图像帧序列按时空顺序堆叠而成。本文从三维空间考虑,将视频中面部表情和上身姿态的运动变化看作是三维时空体运动,提出一种面部表情结合上身姿态的双模态情感识别方法,以有效克服单一模态情感识别的局限性,获得了更加可靠的情感识别结果。(2)针对体积局部二值模式算法应用在视频情感识别中存在运算复杂度高和识别准确率低的问题,本文提出一种时空局部二值模式矩(Temporal-Spatial Local Binary Pattern Moment,TSLBPM)的特征描述方法。首先对视频序列采用K-均值聚类得到人脸表情和上身姿态序列;然后对人脸表情和上身姿态图像分别进行均匀分块并提取TSLBPM特征,计算测试样本的特征向量与训练集中每一样本特征的欧式距离,将每一情感类别中的最小距离作为证据构造基本概率分配值;最后使用D-S证据理论融合两种模态的情感信息进行判别输出,得到最终的情感识别结果。实验结果表明,本文提出的TSLBPM算法较原始体积局部二值模式算法具有特征维数低,表征能力强,情感状态识别效果优等特点。(3)针对TSLBPM算法在局部纹理细节表达上存在的局限性,提出一种复合时空特征的双模态情感识别方法。首先在TSLBPM算法的基础上,增加自适应阈值,进行三值量化计算,提出时空局部三值模式矩(Temporal-Spatial Local Three Pattern Moment,TSLTPM)算法。实验结果表明,相比TSLBPM算法,TSLTPM对图像纹理刻画更加细腻,更有利于情感信息的充分表达。另外,为了避免单一特征表征能力的不足,加入三维梯度方向直方图特征,从图像边缘和方向对情感信息进行特征描述,与TSLTPM组合成复合时空特征。复合时空特征算法有效增强了对视频的情感信息表达能力,优于改进前的两种单一算法和相关文献中的方法,通过D-S证据理论实现信息融合,有效增强了整个系统的识别性能。
其他文献
随着互联网的迅猛发展,人们的生活已离不开互联网,在享受着互联网普及带来的种种益处的同时,信息过载等问题也日趋严重。当快速而准确地找到令人满意的商品逐渐变为一种奢求
电容层析成像作为传统过程成像技术被广泛应用于工业两相流或多相流可视化检测中,在汽车制造、生物医学等领域也逐渐发挥重要作用。为满足现代化生产要求,三维电容层析体成像
随着信息技术的迅猛发展,金融科技与新兴业态不断冲击着商业银行,客户线上化进程速度加快,传统的商业银行普遍面临着严峻的发展挑战。而此时,商业银行个人金融业务正处于重要的机遇发展期。从经济大背景看,国内宏观经济长期向好,居民收入与家庭财富快速增长,国民消费不断升级;从个人金融业务本身来看,对银行缓解资本约束压力、分散业务经营风险、平滑经济周期波动均有着显著影响。因此,商业银行实施数字化转型成为新时期提
学位
如今,互联网技术得到了空前的发展和普及,计算机科学也日渐成熟,企业的办公方式也越来越趋向于信息化、自动化、网络化。但部分企业在人事的管理上,还停留在通过手工处理的层
当前我国经济社会面普遍面临经济下行的压力,随着法律制度和市场监管体系的日益完善,金融领域的管理也日益规范化。新背景之下,商业银行对公贷款的比重也日益降低,商业银行被迫进行业务结构的调整,零售业务也就成了各家银行在新经济形势下促进利润增长、降低经营成本的主要途径。于是,转向零售业务发展已经成为大多数银行的新战略,这也是在利率市场化背景下各大商业银行不得已的选择。目前无论是大型股份制银行还是一些小型银
学位
数字信息化时代,多媒体是信息传递的重要载体和现代化发展的动力,广泛应用于生产和生活当中。一般地,主要包括两大研究领域,分别为数据库存储系统与计算机视觉技术。计算机存
通信设备企业作为高新技术产业中的代表性企业,其技术变革的速度非常迅速。为了提高自身技术水平和技术创新能力,通信设备企业更多地选择与其他有竞争性的企业构建技术联盟作
多目标跟踪自提出以来,涌现了诸多经典目标跟踪算法,诸如卡尔曼滤波、粒子滤波等经典目标跟踪算法都有着较好的滤波性能,目前已经被广泛应用于军事,民用等诸多领域。但由于经
随着经济的发展,科技的进步,大跨度空间钢结构在工程中应用越来越广泛。利用其轻质高强的性质,越来越多的大跨度、大空间的复杂结构形式不断出现。然而,伴随着优越性能的同时,是复杂的施工过程和对其工程质量更高的要求。一旦结构在施工建造、拼装焊接的过程中发生破坏甚至倒塌,将会造成巨大的经济损失,甚至会对人身安全造成威胁。为了保证结构施工过程安全可靠,大跨钢结构多采用地面拼装,整体顶升的施工工艺,因此,保证顶
随着互联网的飞速发展,图像数量呈爆炸式增长。针对海量图像进行分类和管理已经成为新的研究热点,其目标是将特定的图像归类到某一特定的语义类别之中。近年来,视觉词袋模型