视觉词袋模型的改进及其在图像分类中的应用研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:shizhijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网中数字图像不断激增,如何在海量图像中迅速准确地进行分类显然已经成为亟需解决的问题之一。现有的许多图像分类方法一般是通过提取图像底层特征来获得图像视觉信息,但因图像之间存在差别,所以不同图像提取的底层特征数目一般不同。为提高不同图像间的比较性能,研究者们将应用在文本分类领域的词袋模型应用到图像分类领域,称为视觉词袋模型。视觉词袋模型首先对图像进行底层特征提取与描述,对提取出的特征进行量化得到视觉词典,随后将每幅图像表示成基于相同维数的视觉单词频率直方图向量,将该向量作为对图像的描述,最后将图像描述向量代入到分类器中进行分类。本文围绕视觉词袋模型,针对图像分类的问题,对视觉词袋模型的特征提取方法、词典生成方法以及图像表示方法等进行研究,具体研究成果如下:(1)为避免常规构建视觉词袋模型在选取梯度方向离散精度时存在的盲目性,以及不恰当的离散精度构造出的视觉词袋模型分类率不高的问题,研究了在视觉词袋模型中提取图像特征时梯度方向离散精度是否存在明显的阈值,使得选取该阈值时能构造出最佳的视觉词袋模型。基于面向稠密特征提取图像局部特征描述,选择不同的梯度方向离散精度分别进行大量的实验,实验结果充分表明存在一个明显、统一的阈值24,选择该阈值构造的视觉词袋模型能够得到最高的正确分类结果。(2)针对视觉词袋模型采用SIFT算法提取的特征点在区分度和代表性上不高的缺点,提出了一种基于Harris角点和dense SIFT特征加权的视觉词袋模型图像分类方法。采用快速密集网格划分对整幅图像提取dense SIFT特征,为获取特征更明显、更具有代表性的点,利用Harris角点检测算法对图像角点进行检测,以角点像素为中心提取该角点SIFT特征,并依据角点度为角点SIFT特征设置一定的权重,使角点SIFT特征相较于dense SIFT特征更加突出,以便更好地对图像进行描述。实验表明,该特征描述方法构造的视觉词袋模型能获得较高的分类正确率。(3)针对空间金字塔视觉词袋模型缺少对局部特征之间语义分布关系的表达,提出了一种基于语义短语的空间金字塔视觉词袋模型图像表示方法。首先,将局部特征映射为具有一定语义信息的视觉单词,通过统计局部特征邻域范围内其他相关特征点的语义分布情况来构造语义短语。其次,将语义短语采用稀疏编码进行量化生成语义词典,图像则表示成基于语义词典的空间金字塔式稀疏统计直方图向量。最后,将图像表示向量代入分类器中进行训练和测试。实验结果表明,该视觉词袋模型构造方法能够较大幅度地提高图像分类的准确率。
其他文献
随着多媒体技术的飞速发展,复杂背景图像中的文本定位研究不仅丰富了图像处理理论,而且在诸如Internet环境下的图像检索、交通管理中的车牌识别等具有重大的价值。复杂背景文
随着企业信息化建设的快速发展,企业所产生的电子文档越来越多,面对浩瀚的企业内部数据,如何有效获取有用信息成为一个非常重要的问题;另外,由于企业文档涉及商业信息,利用商
随着社会经济的发展,煤炭工业在体制、资源、安全、环境和转产发展等方面的深层次矛盾逐渐暴露出来。山西省作为产煤大省这一问题尤为突出,煤炭工业、产煤地区经济和社会可持续
软件成本估算是软件估算的重要环节,成本估算的精确与否直接影响到软件的后续开发过程及软件开发质量。传统的软件成本估算存在很多不足,国外广泛应用的软件成本估算方法引入到
随着人们对地理信息需求的不断增长和Internet技术的快速发展,GIS技术与Internet技术相互融合形成了WebGIS。WebGIS应用越来越普及,已经渗透到各个应用领域。对于如何快速的开
电信网络的运营业务分为两大部分,即基础电信业务和增值业务。随着信息化的迅猛发展,电信市场的竞争日趋激烈,基础电信业务已经难以满足某些用户的需求。只有不断开拓新业务,
玉米作为世界三大农作物之一,在世界范围的播种面积和总产量中占有重要的地位,是重要的粮食作物和油料作物。我国是一个农业大国,农作物的种类众多,玉米是目前种植面积最大的
K-匿名作为一种简单有效的私有数据的保护技术得到了广泛的关注。它要求发布的数据中存在一定数量(至少为k)的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的
随着互联网信息的飞速增长,越来越多的人将搜索引擎作为网络信息获取的主要手段。但是,在浩如烟海的互联网信息世界中,通过现有的搜索引擎,人们寻找有用信息还是存在着很大的
随着信息技术和互联网的高速发展,互联网上的多媒体资源数量呈爆炸性增长,用户要在如此庞大的资源中快速找到自己感兴趣的资源是非常困难的。推荐系统就是针对不同用户预定义的