图像内容表示与分类方法研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：zhuxuchen0822

【摘要】

：

随着数码相机、摄像头以及高速扫描仪等各种图像采集设备的普及，数字图像和视频成为人们生活中的重要信息记录载体。同时，互联网的迅猛发展，也将不计其数的数字图像和视频资源摆

【作者】

：

张琳波

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2011年期

【关键词】

：

图像内容表示图像分类码本构建多特征融合位置信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数码相机、摄像头以及高速扫描仪等各种图像采集设备的普及，数字图像和视频成为人们生活中的重要信息记录载体。同时，互联网的迅猛发展，也将不计其数的数字图像和视频资源摆在了人们面前。如何高效的组织和管理这些庞大的图像和视频资源以方便人们的各种应用，成为摆在研究者面前的重要问题，基于内容的图像、视频分类技术应运而生。由于视频由大量的图像帧序列组成，因此图像内容分类是视频内容分类的基础，图像内容分类的技术可以直接应用到视频中各帧图像的分类中。　　本文主要针对图像内容分类这一课题，基于bag-of-words图像内容表示方法，从码本构建、分类系统设计以及多特征融合等方面展开研究，主要内容包括：　　第一、针对各种带有互补性的图像特征，提出并设计实现了一种基于多特征融合的图像内容分类系统。该系统使用两种检测子和五种描述子组成十种局部特征；然后，将这十种局部特征利用bag-of-words模型和空间金字塔划分得到多通道的bag-of-words直方图向量；最后，将多通道的直方图向量通过核函数加以融合来提高分类系统的分类准确率。本文将此系统应用于国际视觉对象分类竞赛The PASCAL Visual Object Classes Challenge(VOC)2009，取得了较好的结果。　　第二、针对多类别分类中码本大小、向量维数以及训练图像数目之间的关系问题，本文提出了将类别信息融入码本构建和分类系统设计过程中，并利用分类器投票策略给出图像类别的最终判定结果的方法。码本多样性与码本过大导致向量维数偏高的矛盾在本文方法中得到了很好的解决。此外，在训练每个分类器的时候，负样本数量被控制在正样本数量的三倍以内，有效地避免了正样本淹没在负样本中的情形。最后的实验结果表明，本文的方法可以得到比使用单个全局码本的方法更好的分类性能。　　第三、针对正负样本数量差距悬殊的不对称分类问题，本文提出了利用boosting的方式训练级联的码本和分类器的方法。每个节点上使用不同的码本，既保证了每个码本中正样本产生的码字占据一定的比例，又可以捕获负样本千变万化的局部特征。同时，本文方法可以通过调节系统中的两个参数来调节节点的数目以及每个节点分类器的输出结果，以满足不同的分类需求。　　第四、针对基本bag-of-words图像表示方法中局部特征之间空间排列信息的丢失问题，本文从分析计算机视觉领域bag-of-words图像内容表示与文本分类领域bag-of-words文档表示的关系出发，提出了一种新的加入位置信息的方法。

其他文献

基于单视频运动捕捉数据的虚拟人驱动

人体运动捕捉涉及计算机视觉、图像处理、模式识别和软硬件开发制造等热门领域,有着广泛的应用前景,如安全领域的智能监控、人体运动分析、虚拟现实下的军事训练、人机交互的

学位

运动跟踪人机交互计算机视觉虚拟人模型视频运动

基于混杂自动机的城市区域交通信号控制研究

课题以北京市CBD地区为背景，研究该区域交通信号控制问题。主要利用混杂自动机模型确定路口信号周期单元，根据相邻路口间相互关系和道路车流运动模型确定两个相邻交通路口的信

学位

混杂自动机切换服务系统区域信号控制协调控制

基于贝叶斯网络的脑结构网络研究及其在阿尔茨海默氏症的应用

磁共振成像(Magnetic Resonance Imaging,MRI)技术的飞速发展为研究活体脑的解剖结构和功能提供了客观而有效的科学工具,同时,计算机化的神经解剖学图像处理技术的进步为定量

学位

贝叶斯网络脑结构网络结构磁共振像阿尔茨海默病

复杂系统视角下的大型企业集团技术创新模型研究

面对日益激烈的市场竞争，以技术创新赢取竞争优势是企业发展的根本出路。技术创新整体战略不明晰、创新协同能力不足、市场响应滞后，是影响我国众多企业集团技术创新绩效和市场

学位

复杂系统航天企业技术创新协同机制

导电结构脉冲涡流与超声复合检测方法研究

导电结构在航空航天、铁轨交通、工业生产等诸多领域应用广泛。对其进行结构完整性和内部状态检测与评估是保障关键部件和系统安全运行的关键一环。在实际检测工作中，由于导电

学位

脉冲涡流检测超声检测缺陷检测导电结构缺陷参数响应信号边缘提取

基于MDA的Web应用代码生成系统的研究与实现

随着当今社会信息化建设的逐步深入,Web应用软件的开发越来越受到业界的关注。与此同时,传统开发模式存在的开发周期长、后期维护困难等不足越来越影响Web应用的开发质量和效

学位

模型驱动架构代码生成系统业务逻辑软件开发

年龄结构传染病系统和我国肺结核系统研究

本文可以分成两部分：第一部分(2-4章)建立了非自治年龄结构的SIR模型，年龄结构的肺结核病模型，带有病程的多个易感个体和染病个体的传染病模型，具有潜伏年龄结构的肺结核病和艾滋

学位

年龄结构传染病系统肺结核SIR模型泛函分析

建筑结构变论域自适应模糊滑模控制方法及试验研究

以主动质量阻尼控制(AMD)为代表的主动控制由于控制效果较好，已成为结构振动控制领域的研究热点，并且已经取得了许多研究成果。在实际工程应用中，结构控制中存在大量的不确定因

学位

结构振动控制变论域嵌入式系统自适应模糊滑模控制主动质量阻尼控制

基于MDA的面向WEB应用的可视化建模研究与实现

21世纪的今天，人口不断增长的同时，互联网也在以惊人的速度增长。随着当前互联网信息化程度日益扩大，基于互联网的信息系统得到了广泛的使用.它们大多表现为各式各样的动态Web应

学位

模型驱动开发Web应用可视化建模策略模式

企业集团财务诊断研究

企业集团是产业发展的重要驱动力，支撑着国家的经济发展，关乎国力的盛衰。在国家战略规划的推动下，我国的企业集团开始了跨越式的发展。而企业集团的财务管理在企业集团的经营活

学位

集团企业财务诊断层次分析法数据包络分析综合评价模型

图像内容表示与分类方法研究

与本文相关的学术论文