场景特征可分性与协同求解方法

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:syh95815
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像场景分类是图像理解中高层语义的重要研究内容,旨在通过分析图像的全局统计和关联特征,实现图像场景的语义标注过程,与图像检索的词语标注不同,场景语义具有隐含的特征共性描述,体现一定的无监督特性。正确的场景分类不仅可以发现属于同一类别场景的相似性和不同类别场景的区分性,而且提供了场景和目标的上下文语境关系,有助于得到场景内目标识别的正确结果。协同模型的节点间包含天然的统计依赖关系,具有协同学的最优划分特点,可很好地用于场景分类中。本文主要在协同学的最优求解框架下,构建基于场景视觉信息描述的协同网络结构,以特征的可区分性为目的,研究协同网络的原型向量表达,通过场景特征演化,得到稳定的状态解,形成最终的划分结果,其研究内容和研究工作包括以下几点:1、研究可以有效的表征图像的特征。对两种全局特征PHOG特征和gist特征进行对比,获得协同网络的原型向量和输入特征向量的表达,并使用流形学习方法对数据进行处理,可以在保持特征流形结构的同时有效地降低特征维数,获得协同网络的序参量表达。2、图像的显著性特征的提取和应用。用最大对称外周显著性算法获得图像的显著性特征,并有效的完成复杂场景图像的感兴趣区域的分割和基于显著性的图像分类。3、基于协同学的协同网络用于场景分类。根据协同学的思想,对经过支持向量机分类判决但没有获得正确标记的图像特征,通过协同网络的序参量演化方程进行特征演化,完成对图像的标签的转移过程,从而获得更高的场景图像分类正确率。实验验证了该方法的有效性,可有效提升分类正确率。
其他文献
LTE(Long Term Evolution)是3GPP组织为满足用户需求而制定的长期演进项目,它可以为用户提供宽带高速无线通信服务。LTE技术规范只定义了接口标准,只要产品符合接口标准就能
随着经济以及电子技术的飞速发展,机器视觉受到人们的广泛关注。作为机器视觉的重要发展方向,动态视频中运动目标的检测及跟踪越来越多的应用到智能视频监控、天文观测、工业
随着计算机性能的不断提升和数字图像获取的廉价化,计算机视觉这一领域也得到了飞速的发展,关于人脸问题的研究一直是这一方向的热点,其中人脸检测技术已经日渐成熟。随着应用需
智能视频监控是计算机领域的一个新的应用方向和关注点,通过利用图像处理和机器视觉的相关方法,并分析监控视频,来实现对目标的定位、识别和跟踪,进一步实现对目标行为分析的
随着智能手机,掌上电脑等各种搭载了嵌入式操作系统的移动终端的普及,面向嵌入式手机平台的人脸跟踪技术再次成为研究热点。本文在Adaboost人脸检测算法的基础上,提出了一种
滚动轴承是旋转机械设备中重要的基础零件之一,一旦出现故障可能会引发安全事故造成重大经济损失和恶劣的社会影响。滚动轴承的剩余使用寿命(RUL)是其受损程度的综合反映,因此,准确预测滚动轴承的RUL对旋转机械的视情维修意义重大。论文建立2种模型对滚动轴承的RUL进行预测。(1)研究滚动轴承的特征提取以及特征约简方法。提出将包络解调与数学形态学结合,提取数学形态学特征。同时,基于时域、频域特征指标与数学
运动目标跟踪检测是数字视频技术发展中产生的一个重要研究课题,在基于安全要害部门的视频监控等领域有着广泛的应用,并且在人类社会的其他多个领域具有广泛的应用前景和研究价
会聚透镜作为光学成像系统和数据处理系统中的最重要元件之一,被广泛应用于精密光学仪器制作、射电天文学、雷达系统、透镜天线等领域,最近报道了通过会聚透镜辅助自聚焦有实现
近年来,数字图像信息在网络传输过程中的安全已经成为了人们日益关注的焦点问题,而解决图像信息安全性最有效的技术就是图像加密技术,因此如何对图像进行加密显然已经成为了
图像分割是图像处理、计算机视觉、目标识别等领域中一项最基本的、最重要的技术,也是图像分析领域中一项艰巨的、富有挑战性的任务。医学图像分割作为图像分割中一个不可或