面向视觉感知的图像情感分类研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:lidongying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉信息是人类获取外界信息的重要来源,也是最容易被人类接受和理解的一种信息形式。图像作为一种重要的视觉信息表现形式,受到了人们的广泛关注和喜爱。网络中充斥着大量的图像数据,怎样对如此规模庞大的图像数据进行理解和处理,是迫切需要解决的问题。现有研究对于图像的理解依然主要停留在对图像描述内容的研究,属于认知层的理解。然而随着图像数据量的剧增,尤其是随着互联网技术和社交网络的发展,越来越多的用户喜欢以文本、图像等方式在网络中分享自己的经验和感受,对图像内容的理解已不能较好的满足用户,这使得对图像的最高层语义——情感语义的分析变得更具有重要意义。本文的研究主要围绕图像的情感分类这一主题进行展开,在分析现有研究的基础上,结合视觉认知理论的相关研究,通过综合考虑融合多种图像特征,利用机器学习的方法进行图像的情感识别与分类。本文的主要工作包括以下三个部分:一是对颜色直方图描述颜色信息时忽略空间信息的问题进行改进,采用图像分块的方式,根据图像不同区域引起人的视觉关注程度的差异,利用Itti视觉注意模型提取图像的显著图,对各分块进行基于视觉显著度的加权直方图计算,通过实验对比,验证了本文提出的改进算法的有效性。二是根据视觉认知的相关理论提取能够表达图像情感信息的特征,然后通过与底层的颜色、纹理、形状以及高层的人脸表情特征相结合,生成图像的情感描述特征向量,利用SVM分类器,在IAPS图像集上实现图像的8类情感分类任务。同时,为验证本文提出算法的可行性,还在收集到的规模更大的Flickr图像集上进行同样的情感分类实验,证实了本文算法的有效性。三是将本文提出的图像情感分类算法应用于电影推荐中,通过结合电影海报图像及剧情简介信息进行电影情感识别,为用户推荐符合其情感需求的电影。本文工作的创新性在于将视觉注意模型引入颜色特征提取过程中,使得对图像颜色信息的描述更符合人的理解和感受;同时通过融合底层视觉特征、基于视觉认知理论的特征及人脸表情特征等多种特征,实现了对图像的更加完善的情感信息描述,在一定程度上缩小了“语义鸿沟”。
其他文献
<正>五月音乐节是国家大剧院的品牌项目,至今已连续举行了数届。这个音乐节以室内乐为内容,在近一个月的时间里,集中了国内外高水平的多场室内乐演出。2013年的五月音乐节共
通过对中医骨伤科技术的历史研究可以发现,中医骨伤科技术主要表现为从无到有、从单一到多样、从零散到全面的发展历程。如在晋唐时期,仅有《肘后方》、《仙授理伤续断秘方》
儿童钢琴启蒙教材在钢琴教育中的地位和作用十分重要。自20世纪80年代起,我国开始出现本土儿童钢琴启蒙教材,迄今为止约有20种正式出版使用。但专门针对现有对中国儿童钢琴启
本文研究会计师-客户关系如何影响客户对事务所的选择。研究发现,如果负责某家上市公司年报审计业务的签字会计师不再为原事务所签字或离开原事务所,那么由该会计师负责签字
1977—1989年中国少数民族电影在“十七年”少数民族电影基础上呈现出“从承继到创新,从启蒙到娱乐”的流变特征,具有承前启后的重要性。以符号学视角探究少数民族电影的内涵
前期对地下防水工程的重视与否,直接影响后期建筑的漏水程度。地下防水施工有何要求,地下防水工程需要注意什么,这里将对其进行探究。
中等师范是职业教育中比较重要的一部分,然而,由于录取制度的改革以及毕业生就业压力等因素的综合影响,中等师范学校生源质量在急剧下降。传统的教学模式已经不能适应学生的
将接受美学所提出的“读者中心论”“期待视野论”“空白理论”等理论应用于初中写作教学中,采用“同作互评共改”作文教学模式,打破当前初中写作教学的困境,从而开辟一条新
为确保围护结构施工、土体开挖、地下室施工阶段基坑围护结构本身和周围环境的安全,做到信息化施工,对围护结构及周围环境的监测尤为重要。文章重点介绍基坑围护工程的监测内容
当前,山东食品产业结构调整明显加快,但是存在的问题也很突出。明确食品经济管理研究基地的总体11标、主要任务和工作重点,有助于有针对性地开展山东食品经济与管理问题的研究。