基于子空间相似度和四元数的场景图像分类方法研究

被引量 : 0次 | 上传用户:mgqzhineng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景图像分类在图像检索和视频检索领域得到广泛的应用,已成为计算机视觉领域的一个研究热点。场景图像分类的主要难点问题是低层视觉特征与高层语义之间存在―语义鸿沟‖。近年来,基于视觉词包(BOW)模型的图像中层表示方法很好的解决了该问题,得到广泛的关注。本文主要围绕场景图像的低层视觉特征提取算法,以及中层表示方法进行了研究。具体研究内容如下:  首先,为了提取具有更多空间上下文信息的图像特征,提出一种结合HOG算法和Gabor算法的改进的Gabor特征方向直方图局部特征提取算法。HOG算法采用密集的网格和相互重叠的局部区域块提取图像特征,增加了相邻区域间的相关性,使特征包含更多的上下文信息,且具有良好的局部不变性。但HOG算法只能提取水平方向和垂直方向的梯度特征,而 Gabor算法可以提取多方向和多尺度的Gabor特征,所以本文基于HOG特征的提取过程,结合Gabor算法提取图像多方向和多尺度的Gabor特征。最后,采用BOW模型对场景图像进行分类,分类结果不仅证明改进后的特征提取算法比改进前有更好的分类效果,同时也证明了BOW模型不能有效区分不同场景中存在相同对象的图像。  其次,为了能更好的区分不同场景中存在相同对象的图像,本文构建了基于子空间相似度算法的场景图像分类模型。该算法首先分别对每一类图像建立视觉词典,这样得到的视觉词典中暗含了类别标签,有利于区分不同场景中相同对象的差异。然后,对每类视觉词典应用核主成分分析(KPCA)算法构建最能表征该类视觉词典的子空间,同时利用 KPCA算法的核函数来度量输入特征与每一类子空间的相似度,使用输入图像到子空间轴的平均投影长度作为图像的中层表示特征对图像进行分类。本文通过一系列比较实验验证了子空间相似度算法的分类效果,同时分类结果体现了彩色信息对于自然场景图像分类的重要性。  最后,为了进一步提高场景图像的分类精度,本文引入彩色特征,并且使用四元数奇异值分解(QSVD)算法来提取图像的彩色特征。本文用四元数矩阵表示一幅彩色图像,然后对图像的四元数矩阵进行奇异值分解,将分解得到的第一个特征图像作为原图像的彩色特征。最后,论文通过比较实验说明了彩色特征有利于提高场景图像的分类精度,且四元数奇异值分解算法提取的彩色特征比RGB模型分三个通道分别提取的图像特征有更好的分类效果。
其他文献
极限学习器(Extreme learning machine, ELM)是训练单隐含层前馈神经网络有效学习算法。ELM克服了基于梯度的学习算法的很多不足,如局部极小、不合适的学习速率、学习速度慢等
语音分离将目标语音从背景噪声中分离出来,去除了语音中的噪声,提高了听感知质量和可懂度,可广泛应用于助听器、移动通讯、语音识别、说话人识别等领域。基于深度学习的方法
无线传感器网络集成了多种技术,是由若干具有一定存储能力、处理能力的传感器节点组成的。由于受其大小的限制,节点采用微型电池作为电源提供能量,但微型电池的能量是有限的
自然科学、工程设计、生产实际和现代化管理等领域中的很多实际问题都可以转化为目标优化问题来求解。优化技术是用于求解各类工程近似解或最优解的技术手段。一些传统的优化
1976年,公开密钥密码体制的提出是密码学的一次变革,它开辟了密码学的新时代,使得密码系统具有更高的安全性。但是,随着科技的不断进步和计算机的更新换代,攻击者破解加密信
图像分割是一种将图像分成互不重叠的区域并提取出感兴趣目标的技术,它是进行图像分析与理解的前提,图像分割的好坏直接影响到图像的分析结果,因此,图像分割在理论和实际应用中都
对无线自组网的研究主要有三种方法:软件模拟技术、实物测试床技术和半实物仿真技术。软件模拟技术通过对计算机模型来研究无线自组网的运行规律,该方法成本小、周期短,而试验
随着互联网宽带用户的普及和网络视频内容的爆炸式增长,流媒体点播服务使得人们接受信息,交流信息的方式发生前所未有的改变,流媒体点播服务已成为当前互联网最热门的应用之
随着计算机技术的飞速发展,多媒体数据的急速膨胀给我们带来了机遇和挑战。在浩如烟海的多媒体数据中,图片和视频具有生动形象的特征,能给人耳目一新的感觉。怎样在众多的图
我国目前煤矿开采业存在机械化、自动化、信息化程度低等技术不够成熟的问题,是导致煤矿事故频发的主要因素之一。矿井机车运输作为煤矿井下开采过程中的重要一环,它对提高生产