【摘 要】
:
针对传统密度聚类算法因使用全局变量导致对不平衡数据集的适应能力较差的问题,提出了一种基于最小生成树的密度聚类算法.首先进行数据集密度峰值计算,用于估计全局密度;然后
【机 构】
:
山东科技大学计算机科学与工程学院,山东省智慧矿山信息技术重点实验室
【基金项目】
:
国家重点研发计划项目(2017YFC0804406);国家自然科学基金(91746104)
论文部分内容阅读
针对传统密度聚类算法因使用全局变量导致对不平衡数据集的适应能力较差的问题,提出了一种基于最小生成树的密度聚类算法.首先进行数据集密度峰值计算,用于估计全局密度;然后通过密度聚类将数据集划分为高密度区域和低密度区域;接着构建和分割最小生成树对低密度区域内样本进行关联挖掘,用于将高密度区域与低密度区域互联;最后计算簇密度并以此作为特征进行簇合并,得到聚类结果.该算法结合图论知识,将数据按密度特征进行分块后合并处理,克服了传统密度聚类算法存在的局限性.通过选取多个不平衡人工数据集和UCI数据集对该算法进行测试,
其他文献
讨论了我国实行工程量清单计价模式以来,工程造价人员队伍出现的一系列问题,详细分析出现的原因,并提出了相应的解决方案,以期望完善人员管理制度,在相对完善的管理模式下,引
由于反刍动物瘤胃微生物的存在,致使寡糖在反刍动物中的应用一直未能大力推广开来。近来大量的研究表明,虽然寡糖在瘤胃内有一定的降解,但添加寡糖能对反刍动物的免疫功能及
本研究以全国中小学教师教育技术能力建设项目和广州试验区项目研究为契机,探讨教师教育技术能力培训准入机制和培训策略,概括瀑布式培训体系的基本运作机制以及以效果为导向的
成果法与完全成本法的纷争由来已久,基于"机械性"假说和"无效应"假说,从两种方法发展的过程来分析这其会计处理方法,认为就整个资本市场的最终结果来看,成果法与完全成本法对
为研究柴油车变速器怠速异响,建立了柴油车传动系统当量力学模型,试验得到了发动机飞轮转角波动函数,研究了离合器扭转特性对怠速异响的影响趋势,并对扭转特性进行了优化设计
侵位于东准噶尔卡拉麦里构造带内的卡姆斯特岩体是该花岗岩带内最西侧的小型岩体,岩石类型为中粒黑云母花岗岩和细粒花岗岩,为同源岩浆演化的不同产物.该岩体主量、微量及稀
随着轮毂电机的深入研究,有必要建立专用的轮毂电机性能测试平台。以数字信号处理器(DSP)为核心,设计了无刷直流轮毂电机控制系统的硬件和软件,搭建了轮毂电机性能测试平台,
针对分布式光伏接入电网将产生诸多影响,通过理论推导研究了光伏发电在不同接入位置、不同接入容量时对系统电压以及网损的影响的变化规律,并采用系统电压改善程度、有功损耗