论文部分内容阅读
情感在人类的感知、决策等过程中扮演者重要的决策,情感活动离不开周围坏境。人类在应对外界各种刺激时产生的心理方面的强烈反应即为情感,一般包括欢乐、厌恶、恐惧、悲伤、惊讶、愤怒等。图像中蕴含着丰富的情感,图像情感是指人类观察图像信息时所引起的一种心理反应。随着数字技术的不断发展,大量的数据信息以图像的形式进行存储。如何利用计算机技术自动识别图像中的情感近年来受到广大学者越来越多的关注。图像情感分析在人工智能、情感计算、图像理解、模式识别等领域中的一个重要研究方向。本实验采用自适应神经模糊推理系统模型来建立图像低层特征与高层情感之间的复杂映射关系。文章的具体研究内容及创新点概括如下: (1)图像的颜色、纹理及形状特征是其最基本的低层可视化内容,人们在接收图像信息时,会受到这些视觉特征的影响从而产生各种不同的情感体验。文中介绍了颜色、形状、纹理特征与人类情感的对应关系以及提取这些特征的常用方法,对于这些特征结合所构成的高维情感特征空间采用了主成分分析法降维。 (2)针对人类情感的特点:具有强烈的主观色彩、模糊性及复杂性。本文采用自适应神经模糊推理系统进行建模,它是神经网络与模糊推理系统两者融合而成的一种人工智能方法。神经网络的分布存储信息和并行计算的性能,使得其具有良好的容错性、高度的非线性和自学习、自组织和自适应性等特点。模糊逻辑具有处理非精确数据、模糊语言信息,可利用专家知识等优点,可模拟人类智慧进行判断和决策。二者的优势互补所融合而成的模糊神经网络对于处理图像情感信息具有独特的优势。 (3)本文采用的图像数据集是国际情绪图片系统IAPS(international affectivepicture system)中的图像,美国情绪与注意研究中心对该图片库中的图像从效价、唤醒度、优势度(Valence,Arousal,Dominance,V-A-D)三个维度进行了评定。这三个维度不仅能够描述情感的主观体验,同时与情感的外部表现、生理唤醒具有较好的映射关系。文中将图像底层视觉特征及图像的三维情感值作为输入输出数据对进行模糊神经网络系统建模。利用MATLAB软件进行仿真,并对仿真结果进行研究分对比分析,证明了该模型的有效性。 (4)本文首次提出建立图像低层特征与人类三维情感值之间的映射模型。已有实验表明,情绪范畴在三个情感空间中可以很好地分离,因此根据三维情感值能有效地对图像情感进行辨识,可将V-A-D三维情感值作为搭建图像物理特征与高层情感语义之间映射关系的桥梁。本文所提出的模型的有效建立对于更深刻地描述图像、提高图像情感识别准确率、使计算机识别图像的能力接近人的理解水平,推动图像检索和图像理解具有一定的理论意义和学术价值。