【摘 要】
:
针对传统K-means算法随机选择初始聚类中心容易造成聚类结果不稳定且准确率低等问题,基于拟蒙特卡洛(Quasi-Monte Carlo,QMC)方法提出一种新的初始聚类中心确定方法;该算法利
【机 构】
:
中国计量大学理学院,中国计量大学量新学院
【基金项目】
:
浙江省自然科学基金项目(LY14F030020)
论文部分内容阅读
针对传统K-means算法随机选择初始聚类中心容易造成聚类结果不稳定且准确率低等问题,基于拟蒙特卡洛(Quasi-Monte Carlo,QMC)方法提出一种新的初始聚类中心确定方法;该算法利用QMC序列分布的超均匀性特点,对整个样本空间中的样本分布进行采样估计;基于k近邻距离(k-distance)对QMC序列点进行加权的K-means聚类,得到初始聚类中心。该算法的计算复杂度为O(max(d、n)logn),其中d、n分别表示样本数据的维数和数量;在人工数据和实际数据集上的仿真实验表明,该算法能选择更优的初始聚类中心,有效降低K-means算法的迭代次数,提高聚类的准确性、鲁棒性和收敛速度。
其他文献
互联网的纵深应用,产生了大数据的概念。可以通过对大数据的挖掘,研究分析并影响到商业决策。大数据时代成为了中国商业模式革新的重要背景和助力。以大数据为基础,中国企业
高桂滋将军作为一位行伍出身的旧军人,与共产党人的交往充满了传奇色彩,他在抗日战场上所建立的功勋,已经载入史册,他在晚年为祖国的社会主义革命和建设事业又尽其所能,多有
为探讨酱牛肉加工过程中挥发性成分组成及变化规律,设计正交试验对顶空固相微萃取(HS-SPME)条件及解吸时间进行优化,并结合气相色谱质谱联用(GC-MS)对酱牛肉加工过程各阶段样
目的:研究槲皮素对野百合碱(MCT)诱导的肺动脉高压大鼠肺动脉平滑肌细胞增殖和肺动脉结构重建的调节作用。方法:成年雄性SD大鼠40只随机分为4组:正常对照组(对照组)、MCT诱导
随着国有企业改革的不断推进,我国国有企业的政企关系不断变化,实现政企分开成为上世纪90年代以来改革的主要方向。然而,在当前的国资委体制下,国有企业仍然未能建立真正意义
本文分析了目前硬盘软修理的现状,主要讨论了基于硬盘的出厂格式化的原理的可能性与成功率的评估,简介了硬盘软修理软件的使用方法技巧及具体实际效果,提出了终极化修理的概
在英语学习中,口语能力的训练是以学生自主学习和训练为主的活动,训练成效主要决定于练习者的主观努力。在这样的训练和提高的过程中自主学习的能力就显得尤为重要。而在交流
目的本研究旨在系统评价表皮生长因子酪氨酸激酶抑制剂(Epidermal Growth Factor Receptor Tyrosine Kinase Inhibitor EGFR-TKI)治疗体力状况较差(PS≥2分)的晚期非小细胞肺
根据实际工程,以30 m高等截面钢烟囱为例,阐述自立式钢烟囱的设计方法,特点以及设计中应注意的问题。
软件体系结构的风格有很多,但最主要的也是最常用的不外乎客户/服务器(Client/Server,C/S)风格和浏览器/服务器(Brows-er/Server,B/S)风格。本文简单介绍了二层C/S、三层C/S