基于特征降维的场景分类方法研究

被引量 : 0次 | 上传用户:wdhpll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景分类是根据给定的一组语义类别对图像进行自动标注,对于物体识别、基于内容的图像检索、图像滤波和图像增强等都有很大的帮助。但是,由于图像中存在着光照、尺度、旋转、视角和姿态等多种变化,正确地识别场景类别难度很大。本文对场景分类技术进行了研究,分别提出了一种基于金字塔图像表示的SIFT视觉单词特征降维的场景分类方法和一种基于多特征降维融合的场景分类方法。经研究发现,在进行场景分类时,使用的高维图像特征中总会包含一些冗余信息或噪声。这不但会增加场景分类系统中分类器的学习复杂度,还会影响到分类的准确率和效率。因此,本文提出在场景分类中对特征进行降维处理。本文首先提出了一种基于尺度不变特征变换(Scale InvariantFeature Transform,SIFT)特征视觉单词(Visual Word)降维的场景分类方法。首先把图像划分成大小相同的子块,基于子块提取特征。在本文方法中,基于三种不同大小的子块提取特征共同表示图像,即提取了三个尺度的特征。并使用词袋模型和稀疏编码得到子块的编码表示,然后利用空间金字塔把图像划分为不同区域,通过特征合并得到每个图像区域的特征表示,对所有区域同一视觉单词的特征分别进行降维,最后拼接降维后的特征向量得到整幅图像的表示。实验结果表明,对基于空间金字塔表示的图像进行视觉单词降维,不仅利用了图像的空间信息,还去除了其中的冗余信息和噪声,进一步降低了分类器输入向量的维度,使分类器可以得到更好的学习效果,从而提高场景数据集的平均识别准确率(Average Recognition Accuracy)。本文方法在Scene-8场景图像库上的平均识别准确率达到89.5%;在Scene-15场景图像库上的平均识别准确率达到84.0%,比已有方法高出了3.0%-3.7%。本文还提出了一种基于多特征降维和融合的场景分类方法,对每个特征的视觉单词降维后再进行加权融合,并对不同特征分配不同的权重。这有利于更好地表示图像信息,提高场景分类的准确率。实验结果表明,本文方法在Scene-8场景图像库上的平均识别准确率达到90.5%;在Scene-15场景图像库上的平均识别准确率达到86.5%,比已有方法高出了3.0%。
其他文献
目的 :研究一种治疗男性外阴局部散热不良致不育的方法 ;方法 :用精康散凉敷治疗男性外阴局部散热不良不育证 ,每次持续 2h~ 3h ,2个月为 1疗程 ;结果 :2 70例中 ,临床观察疗
随着城市化进程的迅速推进,土地征迁活动逐渐增多。土地征迁工作应制定充分完善的安置补偿模式来保障失地农民的利益,这也是促进土地征迁工作顺利开展的关键之处。我国西部地
公交站点是城市基础设施的重要组成部分,优化城市公交站点布局,对满足公交车辆停靠和乘客出行需求,具有重要的意义。从社会福利最大的角度出发,分析公交站距设定的影响因素,
<正>1.著作简介阿玛蒂亚·森的《贫困与饥荒》一书用了一种不同于之前的视角解释了饥荒这一社会现象,那就是贯穿全书的——权利分析方法,并提出了一些他自己的不同于前人的观
所谓疑难案件,就是法律原则无法有效加以规范、存在多种理解、利益冲突较为复杂的案件。本文分别结合具体的案例,逐步探讨了疑难案件的成因、难点及解决办法。
<正> JZ—7型机车制动机自1974年装东风42005号机车一台,配属丰台机务段和北京内燃段运用考验后,1975年至1g76年又装东风4内燃机车30多台及东方红<3>内燃机车10多台,分别配属
筝的演奏,左手是灵魂。而古筝左手技法中的"颤音"是古筝艺术"以韵补声"一个最具特色的重要技法。在古筝演奏技术发展过程中左右两手技法逐步趋于统一的情况下,左手作韵的"颤
本文阐述了道家"无为而治"思想的社会内涵,并在两个方面揭示了道家"无为而治"思想在企业管理上的现代价值。第一,在行为上要求管理者"逆其自然"者有所不为,而"顺其自然"者则
煤层气是一种非常规天然气,在煤矿俗称“瓦斯”。一方面,它严重阻碍了煤矿的安全生产;另一方面,煤层气的主要成分是甲烷,其温室效应是二氧化碳的22倍,所以煤层气也是造成温室效应的