流形学习及其在图像集分类中的应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:ITlogileon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步,我们所采集到的图像数据相较于以前不仅数量在变大而且维数和复杂性也在增加。同时,这些海量复杂的数据基本上都是非线性的,传统的学习算法无法有效的度量数据之间的相似性,而黎曼流形学习可以较好的抽取到这些数据中所蕴含的非线性结构特征。此外,传统的分类算法都是基于单幅图像的,而基于图像集的分类问题目前受到研究者们的广泛关注,主要是由于图像集相较于单幅图像具有更加优异的灵活性和容错性,因此,本文的研究重点主要集中在黎曼流形学习及其在图像集中的分类应用上。本文从已有的基于图像集分类的流形学习算法出发,针对流形学习中的核方法、降维方法以及多模型度量学习方法进行研究,提出了改进算法。本文的主要贡献为:(1)从理论上详细的介绍了几个经典的基于图像集分类的流形学习算法的基本思想以及实现步骤,并分析了它们各自的优缺点。然后通过在几个基准数据集上进行实验,直观的分析和比较它们之间在分类能力和计算时间上的差异。同时,对于几个经典的黎曼度量也介绍了它们的具体定义形式。(2)最近在生物神经学领域中的研究表明生物神经中的感知理论同黎曼流形相符合,同时相关研究发现Log-Gabor滤波器与人眼的非线性对数特性相一致。由于这两者的结合符合人类视觉的感知过程,因此提出了基于Log-gabor滤波特征的黎曼流形图像集分类算法。引入Log-gabor滤波器的目的是为了有效的解决二阶统计特性无法充分的捕捉到复杂图像的特征信息的问题,同时多尺度多方向的滤波特征也可以较为有效的消除原始图像中的冗余信息,从而提高了所学特征的判别能力。该算法在多个数据集上都取得了较好的实验结果,从而验证了其有效性。(3)基于图像集分类的流形降维算法的核心思想是把一个高维的流形直接降维到一个维数相对较低同时判别信息更加充分的新流形上,且在多个实验数据集上都取得了较好的结果。例如Grassmann流形上的投影度量学习(Projection Metric Learning,PML),该算法是基于投影度量(Projection Metric,PM)并且使用黎曼共轭梯度(Riemannian Conjugate Gradient,RCG)算法优化目标函数。但是对于复杂的数据集如YTC,其分类结果不佳,同时RCG算法的时间效率较差。鉴于上述缺点,提出基于切空间判别学习的流形降维算法,该算法首先通过添加扰动的方式将Grassmann流形上的元素变换到SPD流形,然后利用对数欧氏度量(Log-Euclidean Metric,LEM)将其映射到一个切空间中,并提出了一个快速的基于特征值分解的迭代优化算法求解目标函数。其在多个数据集上相较于PML等算法都得了更好的实验结果。(4)传统的流形学习算法针对给定的图像集通常都采用单模型进行建模,较难应付复杂环境下的分类任务。针对上述情况,提出多模型建模和度量学习相结合的方法。首先把图像集分别利用二阶统计特性和线性子空间建模到SPD流形以及Grassmann流形,以提供互补的特征信息。对于异构的特征空间,利用黎曼核函数将它们映射到高维的Hilbert空间。最后通过度量学习的方法将它们在低维公共的子空间中进行融合,从而提高了所学特征的判别能力。多个基准数据集上所取得的较好的实验结果验证了该方法的有效性。
其他文献
自创业板市场的推出,为创业板企业提供了更加方便的融资渠道和平台,创业板企业可以利用多种融资途径,实现对企业运营资金投入比例的增加,同时实现对企业资本的扩充。目前越来越多的企业开始重视融资管理问题,在企业融资管理过程中,风险融资管理方式的不同,企业融资的合理性,直接影响到企业的投资规划及发展。因此,创业板企业的发展对融资管理需求较大。然而,在多种因素的影响下,不少创业板企业的融资管理体系存在不足,导
近些年,城市轨道交通在引领和支撑城市发展、推动发展社会经济、优化城市布局结构、降低环境污染、改善交通拥堵、提高公共出行度等方面发挥着越来越重要的作用。但与此同时,城市轨道交通运营安全隐患日益凸显,安全事故频频发生,严重威胁了人民的生命财产安全和影响了我国轨道交通事业的高质量发展。基于此,本文首先从发展历程、研究对象、研究方法、研究内容及实证分析等层面对国内外地铁运营现状进行了研究评述,得到了现有地
环境友好、结构稳定、低成本的橄榄石型正极材料引起众多科研工作者的兴趣和关注,但自身较差的锂离子的传输特性和低的电子导电性限制了此类正极材料的进一步发展。本文以橄
当今社会,居民亲自去医院看病的程序越来越繁琐,简单的数据测量也变得十分复杂,找医生看病咨询通常也需要提前预约排队,给居民造成了许多不必要的麻烦。社会目前处于信息高速
随着移动互联网和智能手机终端的飞速发展,微信作为国内用户使用频次最高的移动社交APP已成为移动互联网的最佳入口。2012年8月上线的微信公众平台,提供了一种全新的媒体信息
政府非税收入是政府财政收入的重要组成部分,在财政收入中担负着遗失补缺的职责。规范非税收入,对推进公共财政建设、落实政府公共服务职能、促进社会的法治化、民主化意义深远。非税收入从其产生、快速发展以来,就受到了政府、学者的密切关注,政府出台了一系列政策来抑制、减少非税收入的过快增长,不断完善非税收入征收管理体系,促进非税收入法制化和非税收入的健康发展。近几年,通过“减税降费”政策,国家清理了一批行政事
自从国际标准化组织于1987年颁布ISO9000标准以来,国外第三方认证公司开始在中国市场着手推广质量管理体系认证服务,随着改革开放的进一步扩大,中国在质量管理体系认证方面的
为了了解和及时反馈医学模拟教学法在外科学基础教学中的效果,本文对医学模拟教育的形成背景、发展情况、国内外研究进展及开展医学模拟教育的意义等几个方面,阐述了医学模拟教育的基本概念和概况。通过对南京医科大学临床医学专业学生进行传统教学和医学模拟教学的对比研究,设计教学案例及评价体系,并通过调查问卷对教学效果进行评价研究。本文采用文献分析法、专家访谈法、问卷调查法、随机对照研究法进行研究。选取2016级
伴随着城镇化的发展、城市人口与经济的增长以及城市居民消费模式的转变,消费者对商品和配送服务的需求也迅速增长。网络购物的兴起极大的改变了购物方式,也促进了快递物流业的迅猛发展。城市作为重要的物流配送网络节点,正面临着大量配送车辆尾气排放,噪声污染等恶劣影响。电动汽车具有能耗低、噪音低、污染小等优点,代替燃油车进行城市运输活动可以极大的改善解决传统车辆城市配送给城市造成的不利影响。然而,与燃油车相比,
随着人工智能时代的到来,深度学习正逐步被应用到日常生活的各个领域,例如,人脸识别、自动语音转换等,并取得了不亚于人类表现水平。然而,受复杂的内部结构影响,深度学习模型