【摘 要】
:
由于缺乏数据分布的先验知识,聚类通常需要对数据做出一定的假设,然后以某种标准来对数据进行划分,但这种假设不一定符合数据的真实分布情况。聚类融合则是一个很好的解决方
论文部分内容阅读
由于缺乏数据分布的先验知识,聚类通常需要对数据做出一定的假设,然后以某种标准来对数据进行划分,但这种假设不一定符合数据的真实分布情况。聚类融合则是一个很好的解决方法,它利用融合函数将聚类算法产生的多样性聚类成员进行合并,能够得到更加鲁棒的、稳定的、一致的最终聚类结果。然而,参与融合的聚类成员(即融合成员)质量差的话,最终聚类结果的准确性可能会降低,这就需要从中挑选出部分质量较好的融合成员,这就是选择性聚类融合算法,其中,最重要的研究内容是选择策略和融合函数这两部分。本文分析了现有选择性聚类融合算法中的选择策略,其中,一类策略主要侧重于挑选出质量较好的融合成员,然而,评价聚类质量存在不同的聚类有效性准则,它们都只适合于特定分布的数据集合;另外,质量较好的融合成员之间具有较小的差异度;另一类策略首先选择出质量最好的聚类成员作为参照成员,然后在选择融合成员时综合考虑质量和差异度的影响,然而,该策略过分依赖于这单个参照成员的选择,并且该参照成员的质量评价也存在上述问题。针对这些问题,本文提出了基于多参照成员的选择策略。该策略首先对初始聚类成员进行分组,这样组与组之间就会具有较大的差异度;然后在每一组内挑选出质量最好的聚类成员作为参照成员,并据此在组内选择融合成员。虽然参照成员的质量评价同样存在上述问题,但由于选择了多个参照成员,使得该策略并不过分依赖于其中某一个参照成员。这样,就能保证选择出来的融合成员具有质量高、差异度大的特征,从而得到较好的最终聚类结果。实验结果表明,本文提出的选择性聚类融合算法是有效的,并且在多数情况下优于现有的选择性聚类融合算法。
其他文献
目的:观察不同临床阶段阿尔茨海默病(AD)患者脑脊液中炎前和抗炎细胞田子水平与神经病理损伤的关系。方法:用夹心武酶联免疫吸附法测定轻、中、重度AD患者.血管性痴呆(VD)患者与正常
CD4+CD25+调节性T细胞是一个具有独特免疫调节功能的T细胞亚群,它能够抑制自身免疫性疾病的发生,维持机体内环境的稳定。动脉粥样硬化作为一种慢性炎症反应,有相关的免疫机制
目的:探讨中医护理临床路径在膀胱癌手术患者护理中的临床应用价值。方法:将58例膀胱癌手术患者随机分为观察组和对照组各29例,观察组采用中医临床路径进行护理:自入院当日起
"来点干货""求干货""全干货"目前成为风靡网络的一个流行词语。而"干货"则逐渐成为一个广泛传播的网络新词。究竟什么是"干货","干货"在日常生活和网络语言中有哪些新的解释呢?一、"干货"的
金属-陶瓷功能梯度材料巧妙地将金属材料导电、导热特性与陶瓷材料绝缘、绝热特性结合在一起,在航天航空、核能、生物等领域得到广泛应用。然而,金属-陶瓷功能梯度材料硬度高
目的探讨数字化X线成像系统(CR)在下肢全长图像拼接的摄影参数。方法以FCR一5000CR成像系统的应用及CR在骨骼系统摄影条件的成像特性,来选择合适的下肢全长骨骼数字化X线的摄影
视觉是人们了解信息的重要渠道之一,是人类最重要的感觉,也是美被感知的前提条件。通过视觉媒介表现并传达给受众的设计被我们称为视觉传达设计,而版式设计是视觉传达设计的
拓扑绝缘体的发现激发了人们的研究热情,它是凝聚态物理的一大胜利。它是导体和绝缘体的交叉部分。它的体态是绝缘体,不可以导电,但是它的表面态或者边界态是可以参与导电的
研究背景p16作为肿瘤生物学标志物现已广泛用于临床病理诊断,且p16蛋白胞浆易位多与恶性肿瘤的不良预后相关。本课题组在之前的研究中发现乳腺癌组织中细胞周期蛋白依赖性激
随着城市中心区的日渐饱和、城市化进程的加快以及城市产业结构的调整,城市新区开发已经成为城市寻求空间拓展和经济增长极的一种重要形式。商业地产的发展对新区的有序开发