基于非负矩阵分解的数据表示算法研究及其应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:cyx810625
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济条件的发展,数据获取的方式越来越多,人们往往需要对大量高维的数据进行分析,但是,经常会遭受数据的“维数灾难”,使得对数据的后期处理变得非常困难。因此,在处理高维数据之前,有必要对数据进行处理。在实际应用中,解决“维数灾难”的有效途径之一是数据表示技术,数据表示技术能很好地解决高维数据难处理的缺陷。因此,为了能有效地便于数据的分析,往往需要对这些高维数据进行有效地表示,使得数据的低维表示能体现高维数据的本质信息。本文主要利用非负矩阵分解(Non-negative Matrix Factorization, NMF)算法来对高维数据进行低维表示,它将原始空间中的高维数据分解成两个低维非负矩阵的乘积,并尽可能地逼近原始高维数据。与其它矩阵分解算法最大不同之处在于NMF算法限制低维分解矩阵的元素非负,因此它是基于部分的表示,所以NMF算法能体现样本的局部特征信息。本文具体内容如下:(1)主要介绍了目前存在的几种主要数据表示算法,其中主要包括线性数据表示算法和非线性数据表示算法,并对其在数据表示时的优缺点进行了分析。(2)主要研究了NMF算法,并对传统的非负矩阵分解算法的优缺点进行了总结,同时介绍了非负矩阵分解算法的相关改进型,并对其特点进行了分析。(3)研究了一种基于邻域保持的非负矩阵分解(Neighborhood preserving non-negative matrix factorization, NPNMF)算法。针对NMF算法没有同时考虑样本固有几何结构信息的缺点,NPNMF算法利用保持样本的邻域信息来保持样本间固有的几何结构。为了利用样本的类别信息,本文进一步对NPNMF算法进行了拓展,研究了一种基于半监督学习的图嵌入非负矩阵分解(Semi-supervised Neighborhood preserving non-negative matrix factorization, SNPNMF)算法,该算法利用硬约束保持样本的类别信息,提高了算法的鉴别性。在COIL20图像库和ORL人脸库中的实验证明NPNMF算法和SNPNMF算法在进行数据表示时其聚类结果都明显要好于其对比算法。(4)研究了一种基于局部一致受限概念分解(Locally Consistent Constrained-Concept Factorization, LCC-CF)的算法。传统的CF算法既没有利用样本的类别信息,也没有考虑局部几何结构信息,而LCC-CF算法不仅利用硬约束在低维空间保持高维空间中标记样本的类别信息,同时还利用局部线性嵌入来保持样本的流形结构信息。在TDT2和Reuters-21578库中的实验结果表明LCC-CF算法的有效性。
其他文献
吡啶化合物是广泛存在于天然药物、农药、配体、自然产物中的重要杂环烯烃,而且吡啶不仅是合成手性二氢、四氢吡啶以及哌啶的重要前体,还是合成生物碱的中间体,是NADH模型中重要的生物活性结构。通过氧化二氢吡啶可以转化为有取代基的吡啶。吡啶、二氢吡啶、四氢吡啶通过还原或者亲核加成是构建哌啶的重要骨架。因此合成含吡啶的手性物质在近几年来引起了很大的兴趣。合成手性吡啶的衍生物最直接的方法是利用吡啶的电子特性去
调查分析了浙江省2017年草莓种植及营销现状,结合2017年浙江精品草莓评选活动,分析参评产品外观商品性和内在品质,比较地区与品种间差异,展现全省2017年草莓生产发展基本情况
近年来,能源需求和环境问题日益严峻,光催化技术由于能够直接利用太阳能,实现太阳能与化学能之间的转化,在解决能源与环境问题方面具有很大的发展前景。开发出高性能的可见光
利用可见光催化技术,我们能将太阳辐射能直接有效地转化为化学能。随着金属配位化学的发展,研究人员突破了低效可见光催化剂的瓶颈。近几年,可见光催化技术应用在有机合成领
玉米清选是玉米联合收获机作业的重要环节,玉米清选振动筛的结构和运动方式对玉米脱出物的清选效率和筛分效果有着直接影响。为提高玉米脱出物在振动筛上的筛分效率,基于传统
<正>T细胞是在特异性免疫中发挥重要功能的免疫细胞,其正常的增殖分化在机体免疫监视、防御中起关键作用。大量研究[1-2]表明,T细胞的异常增殖分化是器官移植排斥反应、自身
轮毂驱动汽车通过将驱动电机直接安装在轮毂内,实现了电机到车轮的直接驱动,是一种新构型的车轮独立驱动系统,具有结构紧凑、传动效率高、传动链短、易于布置的优点,得到了广
目的1.问卷调研选用北京中医药大学东方医院的数据进行统计分析,以初步评价中药配方颗粒临床使用的不同环节中的现象,并从不同级别的医师层面、不同年龄段的患者层面,获取中
蒸散量的计算方法有很多种,表面能量平衡系统(SEBS)是近年来应用较为广泛的计算蒸散量的方法之一。SEBS是应用卫星对地观测的可见光、近红外和热红外波段资料,结合实测气象数
经济新常态下,我国经济发展增速放缓,中小企业面对消费者需求下降、行业竞争剧烈等问题。企业绩效评价能及时反馈企业的经营状况。在新经济态势下,精益战略能帮助企业减少浪