论文部分内容阅读
随着计算机技术的突飞猛进和互联网技术的广泛应用,大量图片、图像等半结构化和非结构化数据涌到了我们的面前。众所周知,绝大多数的图片蕴含着丰富的情感语义,如何有效地组织、管理和检索这些大规模的蕴含着丰富情感语义信息的多媒体数据已经成为当前的一个热门话题。
相关研究表明,图像的视觉特征信息反映的只是图像的一些客观统计特性,并未直接反映出图像的情感语义信息,在图像的低阶视觉特征与图像的高阶情感语义特征之间存在着关联鸿沟。将这一关联鸿沟变通途的方法便是利用机器学习相关算法建立图像视觉特征与情感语义特征之间的映射关系,然而传统机器学习的理论思想以及技术实现始终无法有效地处理那些多媒体数据,特别是那些蕴含着极为复杂但又十分模糊的情感语义多媒体数据。鉴于此,本文的处理途径是合理利用现有的相关理论和技术,并在此基础上加以改进创新,本文所做的工作具体如下:
1.构建逐层分类的架构。之所以要构建逐层分类的架构,本文基于以下两个方面的考量:1)基于人类情感思维过程的考量。众所周知,人在看到一幅图片时,首先会根据图片所呈现的视觉特征(颜色、纹理、形状等)对图片进行分类并在记忆库中进行比对,从而判断出图片的内容,最终图片的视觉特征和内容会刺激人的大脑产生出相应的情感。2)基于决策树思想的考量。决策树从根节点出发沿某一分支逐层向下直至叶结点,且该叶结点代表一个类别,此种分类思想启发了我们在处理类似图像情感语义等复杂问题的时候,倘若对问题进行逐层分类、细化,便可以在削减问题复杂度的同时增加解决问题的精确度,这也是本文引入决策树思想的原因之一。
2.选取合适的分类器。选取一款合适的分类器是本文工作的重点,本文将模糊理论引入传统的支持向量机,将隶属度函数引入传统支持向量机的核函数,这便是模糊支持向量机(Fuzzy Support Vector Machine,FSVM),模糊支持向量机一系列优异的特性令图像情感分类得以有效实现。
3.实验证明。本文以逐层分类思想作为指导,凭借模糊支持向量机实现具体分类,并选取了中国科学院心理研究所心理健康重点实验室编制的中国情感图片系统(Chinese Affective Picture System,CAPS)中的852幅图片作为图片库,验证所构想工作的可行性和准确性。