高维数据集非线性C-Isomap方法的改进研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yqwang1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的飞速发展让我们获取数据变得更加容易,我们关注的数据对象也越来越复杂。学术界和工业界对数据处理和分析技术的需求也更加迫切,尤其是高维和大数据分析处理,是统计和计算机科学技术研究领域和工业界的热门话题。高维数据降维分析与处理是具有重要理论意义和应用价值的问题之一。在这方面,流形学习是一种新的非线性降维方法,用于寻找高维观测数据的低维紧致表示,探索数据的内在规律和内在结构。目前,流形学习已经成为数据挖掘、模式识别、机器学习等相关研究领域的热点问题。这些流形学习方法由于其非线性、几何直观、低精度和计算可行性,在一些人工和现实基准数据集上产生了令人印象深刻的结果。流形学习的基本原理是保持高维到低维空间的拓扑不变性之间的关系。流形学习提供了一些非线性方法,如经典Isomap(C-Isomap)、局部线性嵌入(LLE)、局部切线空间对齐(LTSA)、多维缩放(MDS)等。然而,流形学习方法如C-Isomap仍然存在一些问题,如最短路径和噪声敏感性。为了克服这些问题,本文对经典Isomap(C-Isomap)算法进行了系统的研究和深入的改进。首先,我们介绍了流形学习方法的基本概念,并对它们进行了详细的比较。其次,我们详细讨论了线性和非线性方法。最后,在本文中,我们提出了两种新的C-Isomap方法。我们提出的方法与C-Isomap方法进行了详细的比较。此外,实验结果证明了我们提出的方法的有效性。本文的主要工作概括如下:C-Isomap方法面临两个主要问题,最短路径距离(SPD)和高计算时间成本问题。这两个问题是由于Dijkstra算法而发生的。为了解决这些问题,我们引入了一种新的A*-FastIsomap方法。新提出的方法(A*-FastIsomap)基于带有双桶算法的A*搜索算法。我们将A*-FastIsomap与C-Isomap进行比较,以验证其在高维数据集上的更高效率和更高准确性。实验结果表明,与C-Isomap相比,我们提出的A*-FastIsomap方法更快、更准确。我们提出了一种新的去噪方法,称为A*Noise Remover Algorithm(A*-NRA)。对噪声的敏感性是C-Isomap的核心问题之一。这种方法依赖于A*-Search算法,其中Approximate Buckets包含数据结构。A*-NRA方法的主要目标是最小化噪声、提高效率和优化图。对现实世界数据集的几项实验表明,A*-NRA技术优于并保留了噪声非线性流形学习数据的精确低维表示。为了进一步确认所提出方法的有效性,竞争算法C-Isomap和A*-NRA已应用于分类任务。结果表明,A*-NRA结合分类算法对高维数据集实现了更高的精度和图优化。
其他文献
中医药是中华民族优秀传统文化的重要组成部分,更是中国人民长期使用并行之有效的医疗手段。近年来,“中医偶尔治本,西医总能治标”这一观点在社会各界流行,中医药遭遇极大的信任危机。发生于上世纪六七十年代的中草药群众运动,涉及到如何对待中医药、如何发挥中医药在农村医疗卫生体系建设中的作用等问题。本文围绕运动的核心内容展开,在前人研究的基础上,发掘新史料并开拓新视角,运用文献分析法和案例研究法,对运动的缘起
学位
随着网络数据传输量的快速增长,内容分发网络(CDNs)每天从遍布全球的数千台服务器上缓存并转发了上千亿的用户请求。由CDN提供服务的流量可以被划分为成千上万个域名请求,每种域名请求都包含着不同的用户请求模式,流行度分布以及性能要求等。CDN的目标是将内容以及应用数据以高可用性,高稳定性,以及高性能标准存储并转发给全球的客户。一个关键的问题在于如何减少终端用户从发起请求到收到响应的时间,因为优化CD
学位
近年来,伴随着我国经济的高速发展、人们日益增长的精神文化需求,这个大的时代背景下文化创意产业随之兴起。我国文化创意产业目前正经历着蓬勃的发展,增强民族文化自信、弘扬传承中华优秀文化是社会发展的必然趋势。校园文化创意产业作为文化创意产业的一个重要分支,逐渐走进大众视野,因其广阔的发展空间,得到社会越来越高的关注。在新的社会背景下,应坚持以新的文化观念持续培养创新性人才的教育理念,大学作为文化培育人才
学位
城市滨水区有非常优美和舒适的环境,是城市慢行系统中非常重要的空间载体。一直以来,对城市滨水区慢行空间的研究大多集中在平原城市地区,而针对山地城市滨水区慢行空间研究只占据了很小一部分。但山地城市滨水区慢行空间又与平原城市有着较大的空间特征差异,由于其特殊的地理地貌,其交通系统也更为复杂,滨水区往往与城市之间存在更大的高差和更复杂的环境特征,所以平原城市慢行空间的研究成果不能盲目照搬和套用。目前山地城
学位
近年来,在网络强国、新基建等国家战略的驱动下,我国加快推动NB-IoT、5G等网络建设,移动物联网接入设备数量增长迅速。物联网存在大规模泛在异构跨域连接的特点,这对物联网安全带来了巨大挑战。在设备接入与设备认证方面,目前企业采用的物联网标识大多基于MAC地址、IMEI号、产品序列号等,存在当物联网设备被替换并伪造相关设备属性时,无法被检测到的问题。此外,现有的通过设备指纹特征进行认证的研究中未分析
学位
近年来,随着深度学习技术的快速发展,图像编辑领域取得了显著的进步,其中以人脸为主要篡改对象的“深度伪造”生成技术已经可以伪造出足以欺骗人类眼睛的虚假视频。这些深度伪造的生成技术可以用于创建逼真的多媒体内容,能够给电影制作、摄影、视频游戏和虚拟现实等产业带来极大的裨益,但是也可能被用于恶意目的,比如制作虚假的色情视频进行敲诈勒索,或者制作虚假新闻活动来操纵公众舆论等,因此研究针对深度伪造视频的检测技
学位
西南地区机场建设形成了众多超大方量的挖方填方工程,考虑到西南地区的交通环境和经济效应,便于就地取材的土石混合料是作为山区机场工程回填料的优质选择。土石混合料是一种非均质、非均匀、非连续性材料,其剪切力学特性对山区机场填方工程的稳定至关重要。本文依托国家自然科学基金项目“基于双尺度耦合方法的土石混合料高填方边坡破坏机理及稳定性研究”,开发了一种低成本的块石三维模型重构方法,建立了块石三维模型数据库,
学位
网络交易作为一种依托于互联网技术的交易模式,因其具有便捷性而得到参与者的广泛认可,是目前主流的交易方式之一。但是,网络交易无需双方同时同地进行交易的特点使得网络交易的公平性保证成为了当下的主要挑战。现有的交易平台使用信任系统帮助用户评判其他交易参与者的可信度,从而为交易的公平提供担保,具体可分为基于第三方的信任系统和基于分布式架构的系统两类。但是对于基于第三方的信任系统,其难以应对女巫攻击,并且存
学位
无线可再充电传感器网络(WRSN)是一项新兴技术,旨在提高传统无线传感器网络(WSN)的网络寿命,该网络在传统无线传感器网络基础上替换成可充电功能传感器节。点,增加了可以用作移动充电器的基站、移动充电车MCV和无人机等。WRSN在实现数、据收集的持久性、提高充电效率、延长网络寿命以及在最恶劣条件下以低成本更好地使用网络方面发挥着重要作用。在人类难以更换传感器节点电池的环境中,尤其是在存在清洁能源问
学位
近年来,空间定位技术与移动通信技术迎来了快速的发展,促进了许多提供基于位置服务(location-based service,LBS)的应用的出现。然而,有许多研究表明,LBS服务可能会暴露用户的隐私信息,攻击者可以通过用户的位置信息实现对其敏感隐私信息的推断。针对LBS服务中的安全问题,人们开展了广泛的研究工作,其中常见的位置隐私保护技术包括基于加密的技术、基于虚假位置的技术、基于匿名区域的技术
学位