基于分位数半径的动态K-means算法

来源 :南京大学学报(自然科学) | 被引量 : 0次 | 上传用户:cnsdxl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-means算法是应用最广泛的聚类算法之一,但存在明显缺陷:对初始值敏感,还需给定类的数目.层次K-means算法提出将多次k取固定值的K-means运算所得到的中心点作为类的代表,并通过对这些中心点进行层次聚类来得到更好的初始聚类中心,然而在中心的融合过程中并没有有效利用类的几何信息.从类的几何特征入手,提出一种基于类的分位数半径的动态K-means算法(QRD K-means).此算法在层次K-means的基础上令每次K-means运算的k值变动起来,且又引入了分位数半径的概念,用样本点到类中心距离的分位数作为类的半径,将样本点间的关系简化为各个类的分位数半径与类中心的关系.通过中心点间距离与分位数半径大小的比较对中心点进行融合形成新类,从而快速给出良好的聚类结果,同时也确定了类的数目.在仿真实验中,通过与不同算法在时间和分类精确度上的比较分析,也证明该方法快速有效.
其他文献
<正> 被誉为我国“城市中的森林公园”的宜宾市翠屏公园目前正在修复唐代石刻“千佛岩”,这又将为历史文化名城宜宾市增添一处旅游新景区。 “千佛岩”又名“千佛台”,位于宜
K~+ efflux antiporter (KEA)是一类钾离子反向转运蛋白,属于一价阳离子/质子反向转运体超家族,对植物细胞钾离子的积累和平衡具有重要作用。从烟草品种K326中利用同源克隆的
目的探讨2型糖尿病患者血清中游离脂肪酸对疾病的诊断价值。方法对我院2型糖尿病患者的血清血脂资料进行总结性分析,重点观察游离脂肪酸与血糖的变化关系,与健康体检人员资料
市场经济越发达,法律体系越完备,对避税的打击力度越大。随着我国市场经济的完善和深入,反避税问题日益重要,而其中更以关联企业之间的避税程度广、范围大、影响深远。文章根
西晋时中国僧人通过地处巴蜀的"蜀川牂牁道"到达印度求法,透露出佛教与西南丝绸之路密切关联的潜在可能,到达印度求法的僧人受到了印度国王特殊的礼遇,这一时期巴蜀佛教的地
翻转课堂、微课、幕课等新型教学手段、教学方法不断涌现,给教学工作注入了新的活力.如何结合课程的自身特性用好这些手段、方法,是摆在教育教学工作者面前必须思考的问题.笔
目的通过制备一系列不同油相组成的自微乳处方,从中筛选出能形成相近粒径、表面电荷和均一性微乳的可比处方,进一步考察其对白藜芦醇的增溶能力。方法分别以中链脂肪酸甘油酯