【摘 要】
:
随着科学技术的日新月异,现今人们获取数据的能力也越来越强,所获取的数据往往具有规模大、维度高、多视角和多样化等特征,如何从数据中分析出有意义、有价值的信息尤为显得重要。对数据的分析,需要揭示数据中内在的复杂性和真实维度,并且能覆盖数据的全局和局部结构特征,而子空间表示算法恰好能够从高维数据中挖掘出数据潜在的低维数据结构特征,是一种有效的处理高维数据的方法。近年来,子空间表示的相关问题已成为学者们的
论文部分内容阅读
随着科学技术的日新月异,现今人们获取数据的能力也越来越强,所获取的数据往往具有规模大、维度高、多视角和多样化等特征,如何从数据中分析出有意义、有价值的信息尤为显得重要。对数据的分析,需要揭示数据中内在的复杂性和真实维度,并且能覆盖数据的全局和局部结构特征,而子空间表示算法恰好能够从高维数据中挖掘出数据潜在的低维数据结构特征,是一种有效的处理高维数据的方法。近年来,子空间表示的相关问题已成为学者们的研究热点,比如基于稀疏表示、低秩表示和Frobenius范数约束的子空间表示算法等,在分析高维和多视角数据时都取得了一定的成效,但是,该类算法仍然存在对数据的挖掘不够深入和应用不够广泛的问题。对于多视角数据,现有的多视角子空间聚类算法,在协调利用所有视角的数据信息时,仍然存在不足,从而,造成算法的性能不够好。此外,社区网络数据也是一种复杂的高维数据,在本文中进一步将子空间表示应用于分析社区网络数据。在每个社区中的节点可以看成是在测地线空间中张成的一个子空间,目前对基于子空间表示的社区检测算法研究依然不够充分,而已有的相关算法对网络中的噪声很敏感,缺乏准确学习社区结构的能力。针对上述问题,本文的工作主要从以下几个方面进行:(1)提出自适应参数学习的鲁棒子空间聚类算法。我们立足于Frobenius范数约束的鲁棒子空间表示进行了深入研究,同时学习数据的鲁棒表示矩阵和关联矩阵,还将其中的一个参数设置为自适应学习得到,不用人工手动设置。对无监督的聚类算法来说,参数越少,则算法越鲁棒。虽然,对一个参数的自适应学习可以通过穷举更多参数值而到达同样的效果,但是,当在多个数据集上实验时,若每次都如此的迭代穷举,会使效率大大降低。(2)将自适应参数的鲁棒子空间学习拓展为多视角算法模型。自适应的参数设置对无监督聚类算法有着重要意义,在许多传统多视角聚类算法中,对各个视角数据学习时的参数往往设置为统一的值,这可能会使算法错过了最佳的参数。若用穷举法设置参数,实验调参时的次数将伴随数据视角个数的增长而增长。所以,在本文中提出的多视角子空间聚类算法,其中一个参数将从各视角数据自适应学习得到,不但大大降低了实验调参次数,而且确保学习到了最优参数。(3)将自适应参数学习的鲁棒子空间表示拓展应用到社区检测中。网络中的每个社区都可以由在同一个社区中的节点表示,为找到每个社区所包含的节点,我们将社区检测与鲁棒子空间表示算法融合,学习到子空间就等同于区分出网络社区的结构。对比目前已有的基于子空间表示的社区检测算法,该算法的参数设置为自适应学习得到,而且,该算法学习了网络数据的全局和局部流形结构,对数据中的噪声更鲁棒,对数据的分析更加深入,对数据的学习效果更佳,此外,在合成数据集和真实数据集上的实验,都验证了其优异的数据学习能力。
其他文献
近三十年来,随着改革开放,中国经济快速增长,在未来的一段时间内,中国经济将保持中高速增长的经济新常态,迈入中等收入国家行列。然而中国不同地区、城乡、社会阶层之间的收
社会保障是现代国家的根本社会和经济制度,它是社会稳定的基本保障,它是社会进步文明的突出特征。长期以来,党和国家都非常重视社会保障,先后建立了城镇和农村社会保障制度及体系,使广大城镇和农村居民的生活得到了有效保障。但对比城镇,农村社会养老遇到的瓶颈和问题更加突出,在国家大力实施乡村振兴战略的大背景下,从研究农村社会养老保险入手,进一步研究探讨解决农村社会养老难题具有非常重要的现实意义和深远的历史意义
创新创业课程是开展创新创业教育的载体与依托,课程实施效果影响人才培养的质量。学生作为创新创业课程的直接参与者与感受者,他们的反馈是课程评估的重要考量角度,也是教学质量评定的关键指标。通过学生满意度调查,一方面有利于了解当前学生对创新创业课程实施效果的评价,另一方面有利于高校推动创新创业课程建设,提高课程质量。以人的全面发展理论和顾客满意度理论为研究理论基础,借鉴其他学者编制的课程满意度调查量表,我
收入差距问题一直都是人们重点关注的话题,收入差距扩大由此带来的收入不平等问题,一方面会引发社会矛盾,影响社会和谐稳定,另一方面也不利于我国政治经济活动的有序开展。我
近些年来,高性能计算领域正在快速发展。现有的超级计算机具有更多的处理器核心和更大的集群内部通信带宽,带来了更强大的计算能力和更快的通信速度。科学与工程计算中的数值模拟是高性能计算领域中至关重要的应用类型。其中,负载平衡效率和通信开销决定了数值模拟程序执行数值模拟的质量与该程序的执行速度。为了获得更好的数值模拟质量并加快数值模拟程序的运行,应该使得高性能计算系统中的所有处理器核心都尽可能处于负载平衡
源于西方后现代主义哲学思潮的后现代课程观思想,历经兴起至蓬勃发展后,现已略显沉寂。然后,该理论本身的生命力并未凋零,它的本质内涵仍紧扣时代发展旋律,它的潜在价值仍待进一步挖掘。因此,在21世纪的今天,以信息化的角度重新审视后现代课程观是顺应教育变革所需。后现代课程观在当下构建知识经济、终生学习型社会的大环境中展现出来的思想本质是:强调人的个性解放、差异性与自由全面发展,重视个体创造性、批判性思维培
当前国内经济发展面临下行压力,资本市场波动加剧,历史积累的风险逐渐暴露,市场流动性日趋紧张。债券市场违约事件频频发生,企业的融资环境严重恶化。而股票市场也不景气,公司股价多次下挫,触发了企业股权质押的平仓风险,进而又反作用于公司股价,使得股市融资成本大大提高。这些违约风险严重影响了企业的信用质量,进而减少了企业可融资渠道,加重了融资难、融资贵的问题,也进一步增加了经济发展前景的不确定性,因此银行也
现如今随着网络规模和数据流量的日益增加,传统的网络架构已经无法满足市场上新技术的需求,为此引入了网络功能虚拟化(NFV)的概念。NFV的出现极大地提高了网络部署的灵活性,使得网络功能可以按需分配,从而提高资源的利用率。此外,多播路由作为一种高效率的传输方式,在现实生活中有广泛的应用,如IPTV、视频会议、软件更新等。借助于多播传输,多个用户之间可以共享网络中的资源(尤其是链路上的带宽)。有研究表明
自90年代我国资本市场成立开始,证券市场曾经出现共七轮股价“暴跌暴涨”的市场现象。在我国普遍存在企业之间交叉持股和股权质押的情况下,股价暴跌有可能引起资本市场的连锁反应,从而形成系统风险。如何更加有效地防范区域性系统风险的发生,是现在资本市场监管的重要工作内容。从资本市场监管角度,社会审计是资本市场监管制度不可忽视的组成部分,在防范整体市场层面的系统风险中发挥着重要作用。企业集团是当前资本市场相对
公司司法解散之诉滥觞于英美法系国家,我国《公司法》于2005年修订时新增了司法解散制度,填补了原《公司法》的空白。由于我国司法解散制度起步时间不长,关于该项制度的理论研究及司法实践还尤为稚嫩,因此对其进行更加深入的研究有着重要的理论和实践意义。从法律解释论角度出发,立足于目前的相关法律条文,结合国外立法实践,探讨司法解散之诉的适用条件。第182条规定了四项具体适用条件,在具体个案的审理中,必须同时