【摘 要】
:
针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD)
【机 构】
:
山东师范大学信息科学与工程学院,山东省分布式计算机软件新技术重点实验室
【基金项目】
:
国家自然科学基金资助项目(61572301,90612003);山东省自然科学基金资助项目(ZR2013FM008)~~
论文部分内容阅读
针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD)。该算法基于层次划分,对计算过程进行研究,不需要对数据集进行反复聚类。首先,扫描数据集获得所有聚类特征的统计值;其次,自底向上地生成不同层次的数据划分,计算每个划分数据点的密度,将最大密度点定为中心点,计算中心点距离更高密度点的最小距离,以中心点密度与最小距离乘积之和的平均值为有效性指标,增量地构建一条关于不同层次划分的聚类质量曲线;最后
其他文献
一万四千多只果子狸挣扎在饥饿的死亡线上,全国最大的果子狸养殖基地面临破产。由此发的尖锐问题是:公共危机的成本由部分养殖户独自承担是否公平?谁来补偿养殖户的损失?
文章以我国上市公司为研究对象,在分析盈余管理内涵的基础上,从我国证券市场和上市公司的实际情况出发,充分阐述了我国上市公司盈余管理的各种手段。目的是挖出这些手段之后的深
以代议制形式存在的现代民主制经历了从传统的代议民主制到行政集权民主制的发展。自20世纪80年代西方社会进入信息社会以来,代议民主制遭遇了严重的政治危机,网络民主被视为
【目的】本研究针对携带mariner转座子的质粒pKKma,进行序列分析和功能注释。【方法】根据已知序列设计引物测定质粒序列。构建转座子突变文库,分析转座子转座效率。【结果】
1本研究の背景と目的我々は日常生活の中でしばしば相手に「不同意表明」を行ったり、相手から不同意表明を行われたりする状況に直面する。不同意表明を行うことは互いの関
以往对缓蚀剂在腐蚀产物膜上的缓蚀作用研究的较少,本文通过设计预腐蚀实验,研究了缓蚀剂在含膜表面的缓蚀作用。在实验中用静态挂片法研究了苯并三氮唑(BTA)对A3钢在碳酸氲钠溶
本文根据地震剖面、测井曲线及钻孔岩心等资料,运用层序地层学工作方法对北部湾盆地进行了层序地层划分,并在此基础上作了沉积体系分析和相分析。
学术界对全新世CO2浓度在8kaB.P.后逐步回升的原因有诸多看法.合理估算全新世人类土地利用对陆地生态系统碳储量的影响,是理解上述问题的主要途径之一.然而,史前土地利用面积
<正>诗歌是文学史上最早出现的一种文学形式,是一个民族的文化精华,也是历史文化沉淀的结果。各民族诗歌根植于本民族文化土壤中,所以说,了解一个民族(或国家)的诗歌成为了解