动态图上的聚类算法研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:luorui2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动态数据不同于传统静态数据,动态数据中存在着时间维度,在实际的应用场景中体现为数据的数量以及特征会随着时间动态演化。这也导致无法简单的使用静态聚类方法对动态数据进行分析。对动态数据进行聚类称为演化聚类问题,如何有效地利用历史数据一直是演化聚类的一个难题,现有的演化聚类算法大都受到时间平滑假设的局限,没有从数据本身考虑动态数据的内在联系。本文将演化聚类问题转化为动态图上的聚类问题进行研究,使用数据驱动的方式构建动态图,提供了一种更加鲁棒性的演化聚类分析方法。当前对演化聚类的研究已经引起了大量研究者的关注。但由于聚类属于无监督学习的范畴,缺乏标签信息的指导,所以传统的方法大都基于时间平滑假设。这导致了以下三个问题(1)目前动态数据越趋复杂,很多数据在演化时会呈现出分叉演化的特性,传统方法不能很好地处理这种问题;(2)时间平滑假设对当前数据与最近的历史进行了约束,但当前数据与最近历史之间的时间差在不同数据集中有很大差异,时间平滑假设却只能同等的处理这些数据。这使得传统方法在处理时间差较大的数据时难以获得较好的结果;(3)动态数据由于其演化特性,往往数据样本数量在不同时间会变化,并且随着时间的增长,数据量也会大大增多,导致计算复杂度过高的问题。传统的演化聚类方法往往难以解决这方面的问题。针对这些问题,本文分别提出了三种动态图上的聚类算法进行解决。本文主要的研究工作和取得的研究成果如下:(1)提出了基于演化树的动态图聚类算法,用于处理数据在演化过程中的分叉特性。通过设计树形平滑,利用图的协方差距离度量,获得动态演化树形结构,较好地处理了演化聚类中的分叉现象,并在多个真实数据集上进行了实验,获得了比其他方法更好的聚类效果。(2)提出了基于演化图的动态图聚类算法,利用数据驱动的图结构描述数据复杂演化结构。解决了数据在演化过程中由于时间上大间隔跨度无法平滑的问题。通过利用动态图的邻居关系来对当前时刻的数据进行约束,加入动态图的结构平滑用于求解优化目标,较好地处理了时间片的不连续问题。多个真实数据集上实验表明,该方法不仅提高动态聚类质量,同时还可以发现数据的演化规律。(3)提出了基于图核的演化图聚类算法,用于处理节点剧烈变化的情况,同时降低动态图的聚类算法时间复杂度。通过利用图核来构建演化图,达到对动态图聚类数据进行了大幅度压缩的效果,大大降低了动态聚类算法的时空复杂度,同时提供一种处理节点数目剧烈变化的高效方法。在真实数据集上的实验结果表明该方法在聚类质量和计算代价上均优于同类算法。
其他文献
回射流是造成片空化失稳向云空化转变的主要原因,并且云空化在其产生、发展和溃灭过程中的非定常特性会造成水利机械性能下降、振动、噪声和空蚀等一系列危害,因此备受研究者
聚氨酯硬质泡沫是常用的有机高分子材料,因其具有低密度、优异的热绝缘性和良好的机械性能等特点而广泛应用于建筑、装饰、冰箱等领域。聚氨酯硬质泡沫的缺点是易燃烧并产生
UV-B,波长为280-320 nm,是太阳辐射光谱的重要组成成分,可部分透过大气层,直接到达地球表面。近年来,由于人类生活产生的氯化烃等臭氧损耗物不合理的利用与排放,导致臭氧层变
珊瑚岛礁波浪水动力特性研究对于珊瑚礁工程建设具有重要的意义。珊瑚岛礁地形的独特性使其水动力特性不同于一般的海岸,较一般海岸的水动力学特性更为复杂;其地形独特性主要
超大型海上浮式结构物(VLFS)的研究工作已经得到国内外的高度关注,但迄今为止人们对超大浮体的认识还不够明确。超大浮体的定义,外海波浪、水流、风、冰等动力要素独立或联合
塔中西部地区中奥陶统一间房组主要发育碳酸盐岩缝洞型储层,复杂的地质作用决定了其缝洞发育的非均质性,加大了储层分布预测的难度。在前人的大量研究基础上,本文结合研究区
声矢量传感器作为一种新型声音信号探测设备,在信号处理领域发挥了越来越重要的作用,其特点是在测量标量的声压信息基础上还能测量矢量的振速信息,在通信、声呐等领域的定向
从上世纪80年代开始,资本市场上出现很多无法用资产定价理论解释的金融异象,这使得经济学家对经典金融理论的假设产生了质疑,从而开始从异质信念的角度研究新的资产定价规律
随着多媒体技术和网络技术的不断发展,网络用户规模、网络设备数量及网络视频流量均呈现出爆炸式的增长趋势。越来越多的网络应用趋向于以内容为中心,它们更关心内容本身,而
雾霾天气的情况下,在户外获取的场景图像受到该天气情况的不利影响,导致所获取的图像的对比度信息丢失,色彩变淡,场景中信息受损,使图像所包含的特征信息被覆盖,图片细节无法