【摘 要】
:
K-Means算法对数据集中的每个数据点进行多次处理,因此对于大数据集时间效率不高.为提高K-Means算法的时间性能并使聚类结果更优,利用网格方法定义了单元密度聚合度概念,提出
【机 构】
:
燕山大学信息科学与工程学院,北京理工大学计算机科学技术学院
论文部分内容阅读
K-Means算法对数据集中的每个数据点进行多次处理,因此对于大数据集时间效率不高.为提高K-Means算法的时间性能并使聚类结果更优,利用网格方法定义了单元密度聚合度概念,提出了一种基于网格的改进的K-Means聚类算法(IKMG).IKMG利用网格连通性原理并借助树形结构,将多个密集网格单元作为初始根节点,周围网格作为它的子节点,以此类推,广度优先扩展树最终得到K个聚类树.实验结果表明,IKMG不但大大缩短了K-Means算法对大数据集的处理时间,而且能有效消除聚类结果对初始聚类中心的敏感性,无需人为指定K值,能找出不同大小、不同形状的聚类.
其他文献
通过一起发电机非正常停机事件,联系AVC系统的原理及功能,分析并排除了在这次非正常停机事件中,AVC系统可能引起停机的各种可能性(包括误调节、硬件故障及调节指令错误等)。
硅酸镧镓晶体微天平(LCM)是以硅酸镧镓晶体为压电材料研制的新型压电式传感器,对表面质量负载变化有灵敏的频率响应。在LCM表面浇铸石蜡薄膜,实时监测十二烷基苯磺酸钠在石蜡
在我国市场经济快速发展的推动下,公路工程项目发展及其迅猛。由于公路施工安全事故频发,公路施工中的安全事故成为了人们探讨的热门话题。本文根据笔者多年工作经验,总结了公路
随着农业生产规模的扩大和农产品市场竞争的加剧,产生了农产品行业协会.协会在推动当地农业产业结构调整、促进农村经济繁荣发展、增加农民收入乃至加强农村基层组织建设等发
随着数据库应用的复杂度以及数据库安全功能开放程度的提高,数据库系统安全已经不仅仅是数据库本身的问题,需要从不同维度对数据库及其应用的安全特性进行检测、监控和审查.
应用级checkpointing是一种在大规模科学计算领域中备受关注的容错技术.但是应用级checkpointing技术要求用户决定哪些是需要保存的关键数据,这增加了用户的负担.介绍一个基
细菌脂多糖(LPS)介导的炎症信号主要通过一种跨膜蛋白toll样受体4(toll-like receptor 4,TLR4)传入胞内,引起一系列相应的细胞效应.近年来对该信号通路的研究取得了一些新的
目的:探讨罗格列酮对人胃癌MGC803细胞凋亡的影响及其分子机制。方法:吖啶橙(AO)荧光染色和流式细胞仪分析检测细胞凋亡。同时行bax和bcl-2细胞免疫化学染色和定量分析。结果
采用混合溶剂(氯仿,丙酮)溶解后的聚乳酸(PLLA)与β磷酸三钙(β-TCP)、制孔剂碳酸氢氨(NH4HCO3)复合,冷冻干燥成型制备聚乳酸/β磷酸三钙多孔复合支架材料.正交实验结果表明,
桥梁是现代城市化建设中的重要基础设施,它具有极强的社会公共性,建设时其投资较大且后期运营管理中也相对困难。另外桥梁作为危机管理系统的重要构成部分,应当具备较强的抗震性