基于视觉词袋金字塔的多特征图像分类

来源 :燕山大学 | 被引量 : 0次 | 上传用户:yuesiyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在视觉词袋金字塔模型图像分类中,图像的最终表示形式为视觉单词频率直方图,模型并未充分考虑图像的空间信息,相同类别图像的相似性与不同类别图像的差异性并未在模型中得到充分表示;构建视觉字典后,算法直接对局部特征描述符进行编码,算法并未对视觉字典进行优化,造成该模型图像分类准确率的瓶颈。本文提出视觉词袋金字塔模型的多特征图像分类,在特征融合与特征编码两个方面改进,用以提高图像分类准确率。本文的主要研究如下:针对视觉词袋金字塔型忽略空间信息,本文提出LSC(Localized Soft-assignment Coding)编码的描述符方向特征,首先计算描述符在编码过程中所使用的视觉单词,然后寻找与之使用相同视觉单词编码的局部特征描述符,最后提取两局部特征描述符位置,以此形成描述符方向分布特征,进而完善模型的空间特征。进一步针对视觉词袋金字塔模型忽略空间关系,本文提出边缘方向特征,算法首先对图像进行边缘特征提取,将边缘特征以方向分布的形式进行表示,通过特征融合来增强不同种类图像之间辨别性,进而完善视觉词袋金字塔模型的全局信息。针对视觉词袋金字塔模型忽略的视觉单词相关性,本文对视觉单词筛选进行研究,提出视觉单词与视觉字典之间的相关性系数。相关性系数越低,则对应鉴别力越高,选择单词鉴别力高的视觉单词,进而对局部特征描述符进行特征编码,最后再提取描述符位置特征与视觉单词直方图,以此来提升模型的图像分类性能。针对视觉单词形成过程的随机性,本文提出双视觉单词筛选模型,由于视觉单词是通过描述符进行聚类所形成的,采用两次不同的初始聚类中心与迭代次数,对视觉单词的随机与不确定性进行改进,采用双视觉字典完成视觉词袋金字塔,提取视觉单词直方图、描述符方向特征与局部位置特征来改进图像分类。本文在MSRC、Caltech101、15Scene三个常用数据集验证,分别取得3.6%、1.5%与1.3%图像分类准确率的提升,实验也分别表明本文提出的描述符方向、边缘方向特征、视觉字典筛选与双视觉单词筛选对准确率性能的改进,进一步验证了本文多特征图像分类对特征融合与特征编码两个方面进行完善的可行性与有效性。
其他文献
聚丙烯酸镁是一种具有优异机械性能和耐热老化性聚丙烯酸盐水凝胶材料,但其吸水保水性较差、重复吸水能力低的缺陷限制了在农林保水、建筑材料等领域的推广应用。通过可控合
目前,医疗市场进入了买方市场,,现代营销观念"随风潜入夜,润物细无声",悄然渗入了每个医院.而理论化的营销思想,更是改变了人们对社会、市场和消费的看法,形成新的价值观念和
【正】 GPP即《中药饮片生产质量管理规范》的简称,此规范目前还只是草稿(意见征求稿),在我国已加入WTO,中药市场面临难得的机遇和挑战的时候,规范我国中药饮片生产质量管理
分析了研究中文医学期刊更名变的目的、类型、影响及对策。
台湾原住民族作家于1980年代开启了边缘发声的行动,在初始的文化发声期与汉族作家书写的发展历程一致,以"男性"为主流,至1990年代原住民族女作家始加入文化发声的行列。她们在
结合山东省消防总队研发应用的自动消防设施维保系统,通过分析其设计思路、结构功能及应用前景等情况,提出了消防设施维护保养管理工作中应用信息化管理系统的优势。 Based