【摘 要】
:
k-均值聚类算法易受初始聚类中心的影响而陷入局部最优解.现有聚类中心初始化方法尚未得到广泛认可.本文依据每个类内至少有一个数据稠密区,且处于不同类的数据稠密区比处于同一
【机 构】
:
广东商学院数学与计算科学学院,湖南大学电气与信息工程学院
【基金项目】
:
国家“863”计划重点资助项目(2007AA04Z224);国家自然科学基金重点资助项目(60835004)
论文部分内容阅读
k-均值聚类算法易受初始聚类中心的影响而陷入局部最优解.现有聚类中心初始化方法尚未得到广泛认可.本文依据每个类内至少有一个数据稠密区,且处于不同类的数据稠密区比处于同一类的数据稠密区相距更远的假设,在数据集合上构造一棵最小支撑树,应用根树原理在其上搜索数据稠密区并估计其密度,从中选出密度大且足够分离的数据稠密区,以其内的点作为初始聚类中心,得到了一个聚类中心初始化的新方法.将此方法与现有的方法进行比较,仿真实验表明,本文方法性能更优越.
其他文献
为适应新时期培养高职高专人才的要求,全面提高学生综合素质,必须增设一些新课,压缩原有专业课的课时量。日益丰富的教学内容和相对缩减的课时之间的矛盾越来越突出,已经影响
植被叶面积指数(LAI)时间序列的建模及预测是陆面过程模型和遥感数据同化方法的重要组成部分。MODIS数据产品MOD15A2是目前应用最为广泛的LAI数据源之一,然而MODIS LAI时间序列
由于磷矿的开采和磷在自然界中近乎单向循环,磷资源日益枯竭.污水中含有大量的磷,我国污水排放中的磷量相当于磷矿产量的37.5%,经过处理回收可以转变为磷资源,又可以保护环境
介质的辐射物性的参数测量在高温火焰燃烧诊断、无损检测、生物医学成像等领域有着广泛的应用。传统的直接测量方法得到的大多是测量试件的等效物性,精确的测量通常需要通过
纵观世界各国的竞争立法及有关国际公约,无不将制止不正当竞争,保护知识产权作为其重要内容之一。我国的《反不正当竞争法》亦不例外,它与知识产权(主要是工业产权)专项立法
聚异戊二烯橡胶(IR)是由异戊二烯单体在催化剂作用下,通过本体聚合或者溶液聚合制得的一种重要合成橡胶胶种,因其微观分子结构接近于天然橡胶(NR)(如三叶胶、银菊胶等),故又俗称合成天
随着市场经济的发展以及现代化建设步伐的加快,我国建筑行业发展迅速,相应地,施工企业也迎来了发展的加速时期.但是与此同时,随着市场竞争的加剧,施工企业也面临着更大的挑战
2016年6月,在全国脱贫攻坚、建设全面小康社会的历史时刻,为响应党中央的号召,上海市首批组团式教育人才援藏工作队进藏,积极融入西藏地区的建设事业。进藏以来,工作队以惜时
对德阳市中心城区集中式饮用水水源现状进行了介绍,分析了饮用水水源地存在的主要问题和风险隐患:由于地表水水源来自人民渠干渠,人民渠主要功能为农灌渠,沿线各类污染导致水
为了更好的挖掘“校园一卡通”系统的数据信息,设计了一个基于Spark的校园信息分析系统。该系统的前端开发使用了Django框架,数据处理则使用了Spark分布式框架,分析的结果以