顾及场景复杂度的图像自然场景识别方法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:deathzdw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与互联网技术的快速发展,计算机图像在当今社会生活的各个领域发挥着越来越重要的作用。几乎每天都会产生海量的图像数据,面对如此庞大且纷繁复杂的图像数据,如何对其充分利用面临极大的挑战。图像检索是最基本的图像应用方式,但大部分的图像检索都是基于人工标注的方式来描述图像的整体场景信息,标注信息的准确性受主观因素影响较大,且标注内容的随意性较强,在面对数量庞大的图像数据时,人工标注方法已经显得力不从心,利用计算机进行自动图像标注的需求十分迫切。而场景识别正是实现图像自动标注的关键技术,因此近年来已成为了新的研究热点。与具有强结构特征的人工场景相比,自然场景呈现的特征类型与其场景内容和复杂度有关,因此自然场景识别并不能简单套用人工场景的识别方法。本文提出了一种图像场景复杂度评估模型,并把评估结果作为选择不同的场景识别方法的依据。在此基础上,针对简单的自然场景图像,研究了基于多特征融合和结果反馈的场景识别方法;而对于较为复杂的自然场景图像,研究了顾及空间关系的场景识别方法。本文的主要研究内容和成果包含以下几个部分:(1)图像场景复杂度评估模型本文选择信息熵、能量和熵、角点个数以及图像边缘信息等正相关特征参数建立图像场景复杂度评估模型,采用K-means聚类方法获取不同复杂度等级的特征聚类中心,根据图像与各等级复杂度聚类中心间的距离来评估图像场景的复杂度等级。(2)基于多特征融合和结果反馈的简单自然场景识别对于简单场景图像,研究基于多特征融合的场景识别方法。研究了包括颜色、纹理、形状的全局特征的提取和融合方法,在场景识别方法中引入反馈机制,进行权重自适应学习和调整,实现多特征权重的自动配置。(3)顾及空间关系的复杂自然场景识别对于复杂的场景图像,研究顾及空间关系的场景识别方法。该方法首先对图像场景进行子区域划分,提取各子区域的特征并进行特征聚类,形成各子区域的视觉关键字,进而构建整个训练图像集的空间视觉词典。进行场景识别时,采用SVM分类器衡量相应空间子区域间的相似度。综合所有空间子区域的相似度情况,最终获得该图像场景的识别结果。基于上述理论和方法,本文进行了相应的实验与分析,实验结果表明本文提出的顾及场景复杂度的场景识别方法,在简单自然场景以及复杂自然场景图像集上能兼顾识别精度和识别耗时,取得了较好的识别效果。实验结果验证了本文理论和方法的有效性。
其他文献
二十一世纪以来,随着经济的发展,癌症患者以及其他疾病患者数量急剧增长,不断对我国的医疗水平提出了挑战。如同面对2019新型冠状病毒的袭击一般,我们需要不断地探索、不断地
本文以《英国社会史:1200~1500年》(节选)的原文和译文为研究文本,旨在基于英汉对比分析英汉翻译中再现语篇连贯的方法。语篇连贯既是一个语义概念,也是一个语用概念,与具体
随着计算机及自然语言处理技术的飞速发展,语料库获得了极为优越的发展机会,在过去的数十年里面,取得了令人惊叹的进步。此外,由于全球化进程的加速,对语言服务的需求也在逐
面孔吸引力作为一种明显的面部整体特征,不仅可以传递出大量个体信息,还会影响到交流互动、配偶选择、员工雇佣、选举投票等社会活动。鉴于面孔吸引力如此重要,对其影响因素
随着社会的飞速发展,石化资源等不可再生资源由于其过度使用而日益枯竭,这同时也导致了环境的严重污染,因此开发清洁的可再生资源迫在眉睫。甘蔗渣是一种常见的木质纤维素生
刘因是元代重要的理学家和诗人,也是闻名后世的“隐逸之士”。从元代文学进入研究者视野以来,关于刘因的研究出现了不少的成果,包括对其文学、理学和隐逸情怀的研究。刘因留
尽管我国的扶贫是多中心治理,但缺乏社会工作的介入则是低水平的多中心治理。目前国家正在通过政策推进社会工作介入扶贫,但收效不大。在社会工作立法欠缺与扶贫立法正在积极
本文主要基于韩国高中汉语文化教学现状,结合笔者在韩国两年的文化教学经验,依据第二语言习得、跨文化交际学,教育学,心理学等方面的理论,对韩国的学生汉语文化学习和汉语教
本文首先通过文献研究,对开国以来黑龙江农垦时代下黑龙江版画的表现方式,文化变迁进行了阐述;接着说明在改革开放的大环境下,分析当代黑龙江版画艺术作品的画面形式元素,做
自励书籍旨在鼓励人们积极上进,对人们的生活、学习与工作提出建设性的意见。阅读这类书籍,对于生活在当今快节奏社会的人们,尤其是对于奋斗向上的年轻人来说,有着非常重要的