基于图结构的数据特征表示方法及应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:kuwaning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“大数据”时代的到来,数据挖掘(Data Mining),机器学习(Machine Learn-ing)等分析和处理数据领域迅速发展。这些领域算法的成功主要取决于原始数据的特征表示,合理正确的特征表示可以使算法得到更好的结果。原始数据都包含复杂的内在结构,不同类型的数据其内在结构也有所不同,充分分析原始数据内在结构是构造特征表示的基础。此外,为了挖掘更深层次的信息用以构造更合适的特征表示,通常会对数据的整体分布做出一些先验的假设。一种常见的先验就是流形假设,即高维空间中的数据点都是位于某个低维流形上,或者至少聚集在某个低维流形附近。通过数据流形结构所构造的特征表示更加依赖内蕴的流形结构,并且对实际应用中常见的一些转换保持不变。本文主要关注流形假设下数据特征表示方法,利用数据点之间的图关系近似描述其流形结构,通过编码图结构信息构造三维形状数据和多视图高维抽象数据的特征表示,并将其分别用于三维形状数据和高维图像数据等分类识别任务中。下面列举了本论文的主要工作:1)构造合适的三维模型整体表示对三维形状检索等应用至关重要。本文基于谱图理论对三维网格模型的流形结构进行分析,利用三维网格的拉普拉斯贝尔特拉米算子(Laplace-Beltrami operator,LBO)计算不同的多尺度谱描述子。然后利用得到的谱图描述子联合分布构造模型的内蕴表示。与之前的方法相比,本文所构造的表示利用多种局部描述子,包含更丰富的多尺度内蕴几何信息,并且对模型的变化有较强的鲁棒性。此外,考虑到表示空间的的复杂性,将联合贝叶斯算法引入非刚性三维模型检索框架以计算表示之间的相似性。最后,通过在多个非刚性模型数据集上的实验结果验证了本文所提出的算法。2)有效地学习高维数据的低维表示可以大幅度提高机器学习模型的速度和精度。然而面对多视图高维特征数据,传统方法很难有效挖掘它们所包含的丰富信息,对多视图高维数据的维数约简仍是一个充满挑战的问题。本文结合维数约简的图嵌入框架和多视图的一致性原理,提出了多视图光滑表示投影(Multi-view Smooth Representation Preserve Projection,MvSMRP2)算法和自动加权多视图稀疏重构嵌入(Auto-weighted Multi-view Sparse Reconstructive Embedding,AMSRE)算法。MvSMRP2 首先通过修改的光滑表示模型构造每个视图特征的光滑重构关系,并以此为基础计算每个视图特征的亲和矩阵。为了同时处理多个视图,MvSMRP2将所有视图特征映入核空间,避免不同视图特征的维数差别过大的问题。此外,MvSMRP2基于一致性原理利用希尔伯特-施密特独立性准则(Hilbert-Schmidt Independence Criterion,HSIC)增加不同视图的低维表示相关性。通过HSIC,MvSMRP2在维数约简过程中可以使不同视图之间互相学习。AMSRE利用各个视图高维特征的稀疏表示构造其图结构,并在低维表示中尽可能保持这种结构,同时通过协同正则化方法使不同视图的低维表示尽可能相同,最终利用交替迭代求解方法得到各个视图的最优低维表示。3)在实际的分类和聚类等应用中,单一视图特征通常很难全面地理解样本。虽然研究者们提出了潜空间学习算法来融合多视图特征以构造一个富含信息的表示。但是这些方法往往只考虑到编码多视图特征的互补信息以得到最终的潜表示,而忽视了潜表示的流形结构。本文假设所构造的潜表示具有某种流形结构,并将流形学习框架与多视图潜表示学习结合,提出判别多视图潜空间学习算法(Discriminative Multi-view Latent Space Learning,DMSL)。DMSL可以从多个视图特征中提取到足够的信息以学习一个共同的潜表示。此外,DMSL将流形学习引入潜表示学习中,使潜表示不仅可以包含所有视图的信息,同时能够光滑地嵌入特定图结构中。这个图结构通过充分考虑样本的标签信息以及潜表示的局部邻域信息进行构造。通过图嵌入项,可以有效增加潜表示的判别性。最后利用增广拉格朗日乘子法得到了最优的潜表示。
其他文献
能源是人类社会发展进步的必备要素。伴随着社会经济的快速发展,开发并使用清洁、可再生能源,如:风能、潮汐能、太阳能及生物质能等,已逐渐成为各国研究的主题。但是,这些清洁、可再生能源存在“靠天吃饭”的特性,在将其用于发电时,无法为用户提供稳定的电能。因此,开发并使用大型廉价电能存储装置以消除这些新能源产出电能的波动性及平衡电能产出与消耗,就成为当务之急。当前,液态金属电池已作为一种潜在、廉价的大型电能
学位
复合材料板壳、加筋板壳等复合薄壁结构由于具有高比刚度、高比强度等特点,被广泛用于火箭、导弹、高超速飞行器等航天装备的主承力结构当中。近年来,在深空探测等航天任务的牵引下,运载火箭等航天装备呈现大型化、重型化的发展趋势,结构的承载环境也越来越严酷和极端。随着航天工业的发展,我国对航天装备结构的轻量化设计和低成本设计提出了进一步要求,为了解决航天结构轻量化设计与大型化之间的矛盾,亟需提高我国航天装备结
学位
天然气水合物(又称可燃冰),是天然气和水在高压低温条件下形成的具有笼型结构的类冰状物质。由于其具有能量密度高、分布广泛、储量巨大且清洁的特点,被认为是21世纪最有可能接替煤炭、石油等常规能源的新型绿色能源,是未来全球能源发展的战略制高点。气体水合物应用技术也成为造福人类的新技术,天然气水合物及相关应用技术涉及复杂的相变与气-水运移过程,包括水合物的分解与形成、甲烷纳米气泡的形成与溶解等。探明分子尺
学位
行星齿轮箱广泛应用于风力发电机、直升机、重型卡车、堆取料机和舰船等大型复杂机械装备中。由于其经常在高负荷、强冲击、高污染和工况变化频繁等恶劣环境下运行,同时受到温度、润滑和物理化学的影响,极易导致其关键零部件如齿轮和轴承等出现故障。行星齿轮箱一旦出现故障,将加速装备性能恶化,轻则造成整个动力传输系统失效,重则引发灾难性的事故。因此,开展行星齿轮箱状态监测与故障诊断研究,对于保证机械装备安全稳定运行
学位
海洋天然气水合物是一种储量丰富的潜在能源,实现其高效开采是世界普遍关注的能源研究重点。固态流化开采法是针对非成岩、浅层水合物储藏提出的一种新工艺,其主要流程是将海底水合物流化并管输到海上平台进行分解。水合物流化过程体系温度升高会引起水合物分解,产生的气体会导致管输过程流动异常复杂、加剧输送风险。流化开采内在的安全性要求,是避免水合物在流化与管输环节的大量分解,其关键科学问题是厘清流化开采过程复杂参
学位
柔性管道是海洋资源开发的关键装备,被誉为“生命线”。海洋柔性管道种类繁多,不同的应用形式、传输介质、传输距离、承受荷载和结构组成都有所区别。柔性管道大多采用螺旋缠绕形式的铠装层进行加强,满足弯曲方向柔顺性的同时具备足够的轴向与径向的抗力。因此,铠装加强层的承载能力是决定柔性管道优劣的重要指标。国内海洋柔性管道的研究起步较晚,目前仅有少数几家国外公司可以设计并制造出承载能力优异的柔性管道产品,国内应
学位
糖尿病引起的微循环病变是威胁糖尿病患者生存质量的重要原因之一,而内皮功能紊乱导致的分泌活性物质失衡是诱发微血管并发症的主要因素。NO(Nitric Oxide)作为最主要的内皮释放的信号传导分子,参与了微循环的多种生理过程,并在血管舒张调节等方面发挥了重要作用。NO传输特性与血液流变学、血流动力学以及微血管结构密切相关,其本质是流动-扩散-反应的多物理场耦合问题,也是工程热物理学科的共性基础问题。
学位
采用机载燃料作为冷却剂的再生冷却被认为是超燃冲压发动机主动热防护的最佳技术方案之一。相比于液氢燃料,碳氢燃料更容易储存且操作更安全,并且在冷却过程中可以通过裂解反应提供化学热沉强化传热,同时裂解生成的小分子烃类产物有助于提高燃烧效率。在此过程中,超临界压力下燃料热物性和成分的剧烈变化以及化学热沉的释放对其流动和传热带来影响,而传热状况的改变也会导致燃料裂解特性的变化。因此,超临界压力碳氢燃料在冷却
学位
近年来,我国多个城市出现雾霾天气,大气污染问题已经严重影响了人们的生活和健康,受到了广泛的关注。二次有机气溶胶(Secondary Organic Aerosols,SOA)是造成雾霾的重要原因,也是PM2.5(ParticulateMatter)的主要成分。萜烯是典型的挥发性有机化合物(Volatile Organic Compounds,VOCs)之一,其在大气中的臭氧氧化过程是生成SOA的重
学位
无线网络控制系统利用无线通信网络作为基础设施,实现地域上分布的可移动传感器、控制器及执行器之间的信息交换,从而对被控对象进行实时监测和反馈控制。当前已被广泛应用到工业过程监测和控制系统、智能交通管理系统及智能医疗系统等安全关键系统等方面,具有重要而广泛的应用前景。无线网络控制系统具有自组织性、网络动态变化、能量消耗受限、分节点电量有限等特点。合理调度分配无线网络控制系统中的任务,减少能量消耗、延长
学位