基于局域信息的聚类分析和社团划分的统一方法

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:candry
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来,社团划分和聚类分析被认为是相似的,其目的都是将相似的对象分为一组,但近几十年来都被分开研究,缺少一个统一的框架去处理这两类问题,其中一个重要原因在于向量数据和拓扑数据之间的差异。异质性是网络拓扑中社团结构和向量数据中簇结构存在的共同条件,它表示数据的重要属性间存在差异,相比之下,均质性的晶格网络或随机均匀分布的数据点则不存在团簇结构。以异质性为基础,本文将向量数据中密度的概念扩展至拓扑数据,提出基于局域信息挖掘的“隐含方向性”这一概念,隐含方向性指示了一种层级性的追随关系,即一个对象会指向离自己最近且中心性比自身更高的对象,并在分类上归属于这个更高对象的类别。基于隐含方向性能够更好地识别社团中心,它们的中心性高于其邻居且距离其他中心性更高的对象较远。本文提出了一种快速的局域搜索划分算法,可以高效挖掘个体间隐含的方向性,应用于社团划分和聚类分析。该算法具有线性时间复杂度,并且能够较好地检测网络中的社团结构,识别有意义的社团中心。在均质网络、随机网络与多尺度层级性网络等人工合成网络上,算法能够得出有意义的划分。对于带有真实社团标签的网络数据集的分析表明,算法在速度上明显优于目前线性复杂度的Louvain算法,在划分结果的准确性上也优于很多流行的社团划分算法。将算法应用于城市地点间的流量网络和大脑功能网络,可以得到与实际现象或功能相符的划分结果,为相关研究提供新的理解与思路。基于隐含方向性的通用性,算法还可以应用于由向量数据构成的网络上,通过社团划分进行聚类分析。算法在各类二维测试数据上都有很好的表现,并且在同时存在低密度流形与高密度球状的二维数据上优于近年来新提出的基于密度与距离的最新聚类算法。在人脸图像与手写数字等高维数据集上,算法的优势更加明显,这也表明将数据构建为网络以及网络化的表征有助于更好的揭示个体间深层的内在关系,进行更好的聚类分析。
其他文献
由于客观条件的约束,如信噪比的传输与传感器的设计,卫星所获取图像的空间与光谱分辨率存在互补关系。为便于完成后续的目标识别、地物分类等任务,则需要空间与光谱均高保真的图像。图像融合旨在将多幅图像通过其中存在的关系,利用合适的算法将它们各自的关键信息与特征进行融合,让图像具有更加丰富的色彩与纹理细节,更接近人眼视觉,因此图像融合必不可少。图像融合可根据待融合影像的时相分为两类:一是同时相影像融合;二是
学位
高通量分子模拟方法已经被证明是一种从庞大的金属有机框架(MOFs)数据库中筛选具有潜在应用前景MOFs材料的有力的手段。但是利用传统的高通量分子模拟方法对几十万个MOFs材料进行逐个筛选的效率太低。因此,寻求加速高性能MOF材料筛选的方法势在必行。本文的第一个工作利用机器学习方法(Maching Learning,ML)来加速高CO2/CH4分离性能的MOFs材料筛选过程。本研究首先应用巨正则蒙特
学位
卵巢早衰(premature ovarian failure,POF)属于妇科内分泌疾病,临床治疗较为困难。POF的发病机制复杂,中医认为与肾虚、冲任虚衰等有关,治疗当以补肾填精、调理冲任为主,临床也需辩证施治。西医则认为与遗传、免疫、环境、医源性因素等有关,治疗方法以激素替代疗法、促排卵疗法、干细胞移植等为主,临床中POF的治疗以中西医结合为常见方案。现从中西医两个角度出发,对各自的发病机制给予
期刊
SLAM(Simultaneous Localization and Mapping,同时定位与建图)是智能移动机器人实现自主化的关键技术之一。随着服务机器人市场需求日益扩大,SLAM技术得到了更多研究者的关注。目前大多数SLAM算法都是基于场景刚性假设进行设计的,因此动态环境泛化能力差。此外,单一传感器无法满足复杂环境的需要,通常与其他传感器结合以提高系统的鲁棒性。本文针对以上问题,对视觉惯性S
学位
随着电子设备规模的增大与电路结构复杂性的增加,模拟电路的测试和故障诊断越来越困难。近年来,研究人员试图从数据和模型两个角度来研究测试方法以提高模拟电路故障诊断的准确率。通过对电路可测性的研究,学者们发现测试点的选择是一种有效提升数据分辨率的手段。目前对测点选择的研究大多是基于整数编码表进行的,但由于整数编码表是通过设定电压阈值来判断故障的可分性,这种方法对于一些表现相近的故障无法精确的度量;且目前
学位
平面对称群是欧几里得平面等距线的不连续子群,在平面内两个线性独立的等距平移下表现不变性。因其在晶体学、化学、物理、图案设计等方面的应用价值,平面对称群受到广泛的关注。人们可以凭借与生俱来的感知对称的能力,对17种平面对称群图案进行分类。然而,在过去的几十年里,平面对称群图案的自动分类仍然是一个艰巨的挑战。本文的目的是为了找到一种自动而有效的方法从图片中识别这17种平面对称群结构。本文所做工作如下:
学位
随着互联网和移动设备的发展,线上社交媒体用户数激增,使得在线社交网络(Online Social Network,OSN)已经具有相当复杂的自身特性和行为模式,吸引了很多研究学者对社交网络的特性、模式及规律等进行分析研究。但由于在线社交网络具有庞大的规模,同时涉及到隐私访问限制等问题,使得获取完整的大规模在线社交网络数据具有一定困难。因此,很多研究都是基于社交网络的样本网络进行实验。样本网络的质量
学位
目的 分析社区老年人肌肉减少症(肌少症)的患病率及影响因素。方法 检索PubMed、Embase、The Cochrane Library、Web Of Science、CINAHL、维普数据库、中国知网、万方数据库、中国生物医学文献服务系统等数据库从建库至2021年7月关于社区老年人肌少症患病率及影响因素的相关文献,采用RevMan 5.3软件对社区老年人肌少症患病率及影响因素进行meta分析。
期刊
旅行商问题是一种在组合优化领域广泛研究的NP-hard问题,目前研究学者已经开发了许多不同的群体智能和近似算法来解决该问题。但到目前为止,关于旅行商问题多解优化的相关研究较少,因此本课题主要针对蚁群优化算法进行相应的改进以更好地解决多解旅行商问题。在群体智能算法方面,本文主要总结群体智能算法的结构与特性。在多解旅行商问题方面,本文主要整合相关测试集及评价指标用于算法的有效性验证,并提出一种基于蚁群
学位
城市是典型的动态复杂系统,个体间以及个体与外部环境间存在的较强的非线性相互作用和由此产生的涌现行为是复杂城市系统的重要特征。城市的正常运作有赖于大量个体的高效交互,因而揭示居民间时空交互接触模式所蕴含的普适规律对于包括流行病传播、城市规划及交通工程等各类城市研究至关重要。然而过去由于数据采集的限制,学者们难以获取高时空精度的个体轨迹与交互数据。近年来随着信息通信技术的发展,手机已然成为某种意义上的
学位