基于中层特征表示的图像分类研究

来源 :北京交通大学 | 被引量 : 5次 | 上传用户:aiwoba1215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,网络中积累了大量的数字图像和视频数据,这些数据为人们的使用带来了新的技术挑战。为此,许多专家学者对图像分类、图像检索、目标识别等领域进行了相关研究,而图像特征提取是这些研究的基础工作。图像特征提取是将图像映射到特征集合的过程,针对图像特征提取,目前已经提出了许多优秀的算法,这些算法可以根据语义表达能力的不同进行分类。其中,基于中层语义的特征表示因其性能较好而成为人们关注的研究对象。本文对典型的底层特征表示和中层特征表示进行了分析和改进,并通过图像分类实验对性能进行了验证,具体工作如下:第一,提出了一种基于词袋模型(BoW)的图像空间语义中层特征方法。由于BoW及其改进方法假设视觉词间相互独立,而这种假设忽视了视觉词间的关联性,所以本文提出了结合空间语义信息的图像特征表示方法。该方法通过计算图像中视觉词间的分布距离提取相似的视觉词,组成视觉短语,融入图像的全局空间信息;同时,在这些视觉短语中提取具有语义代表性的视觉短语,建立短语词典来加入图像的语义信息。结合视觉词间的这两种信息,构成新的图像空间语义特征。在UIUC-Sports8图像库和Scene-15图像库进行图像分类实验,实验结果表明这种结合空间语义信息的特征具有更好的分类准确率。第二,对局部二值模式(LBP)进行改进:1)提出了一种基于LBP的纹理短语特征方法;2)提出了一种基于BoWL的图像空间语义特征方法。实验表明,这两种方法都取得了较好的图像分类效果。最后,针对当前网络图像特征方法的实际情况,以及LBP的简单性和较好的表达力,本文还研究了LBP对实际网络图像分类的作用,通过实验结果可以看出该方法能够有效地对网络文字图像进行表示。
其他文献
随着高性能计算技术的不断发展,各种高性能计算方法被广泛地应用于实际工程领域,在国民经济、国防建设和科技发展中占有非常重要的战略地位。相场法是目前用于模拟枝晶微观组
伴随多租赁理念在业界的推广应用,基于SaaS模式的应用已经成为一种高效、先进的业务应用解决方案。单实例多租赁(Single Instance Multi-tenancy)的应用模式体现出其低费用,
作为一种新兴的计算平台,图形处理器(GPU)在科学计算和工程领域展现出巨大的计算能力。GPU也很快由单纯的图形处理加速单元,演变成适合通用计算的处理器(GPGPU)。然而随着计
伴随着计算机的发展过程,各种处理操作现均慢慢要求在处理速度上让用户满意,以增加体验。图像分割作为计算机视觉中一个基础而重要的学科,到现在为至已经被广泛研究。从原有
近年来,问答类社会网络迅速发展,用户量快速增长。经过数年的积累,以人为核心的问答类社会网络正成为互联网的主体应用之一。然而,随着社会网络的蓬勃发展,互联网安全受到了新的挑
中文音译人名属于未登录词,而未登录词识别是自动分词技术的关键问题,自动分词是信息检索、信息抽取及知识发现等方面起着很重要的作用。目前在音译名的识别方面已有很多的研
近年来,视频追踪将计算机视觉、模式识别、人工智能等学科的技术很好的融合在一起,成为视觉研究领域内一个非常活跃的分支,具有广阔的应用前景。尽管已有很多目标追踪算法,但是,由
虚拟化技术在当前数据中心中应用越来越普遍。虚拟化技术通过在同一个物理机上运行多个虚拟机来提高硬件资源的利用率。大规模的数据中心应用虚拟化技术实现资源的高效利用,
随着脑科学研究的发展,一种融合了传统机器智能与大脑智能的混合智能系统的实现变成可能。混合智能系统可以突破传统的人工智能在机器智能方面的局限性,为人工智能发展领域开辟
随着云计算的兴起,软件的交付与使用模式正在发生着变化。作为云计算的一部分,PaaS平台为SaaS应用提供完整的开发、部署及运行环境。租户通过PaaS平台租用自己所需的SaaS应用