【摘 要】
:
聚类是数据挖掘领域中的一种重要的数据分析方法.它根据数据间的相似度,将无标注数据划分为若干聚簇.CSDP是一种基于密度的聚类算法,当数据量较大或数据维数较高时,聚类的效
【机 构】
:
吉林大学计算机科学与技术学院,符号计算与知识工程教育部重点实验室(吉林大学)
【基金项目】
:
国家自然科学基金(60903098);吉林省发改委产业技术研究与开发专项(2015Y055);吉林省科技厅重点科技攻关项目(20150204040GX);吉林大学研究生创新基金(2016183)~~
论文部分内容阅读
聚类是数据挖掘领域中的一种重要的数据分析方法.它根据数据间的相似度,将无标注数据划分为若干聚簇.CSDP是一种基于密度的聚类算法,当数据量较大或数据维数较高时,聚类的效率相对较低.为了提高聚类算法的效率,提出了一种基于密度的分布式聚类方法 MRCSDP,利用MapReduce框架对实验数据进行聚类.该方法定义了独立计算单元和独立计算块的概念.首先,将数据拆分为若干数据块,构建独立计算单元和独立计算块,在集群中分配独立计算块的任务;然后进行分布式计算,得到数据块的局部密度,将局部密度合并得到全局密度,根据全
其他文献
稀土有机配合物发光是无机发光与有机发光、生物发光研究的交叉学科,有着重要的理论研究意义和应用研究价值。稀土有机发光配合物因镧系离子独特的电子结构而成为一类具有独
港口是我国国民经济和区域经济发展的基本产业,是国家对外交流,进行贸易的主要门户。近年来,随着经济全球化步伐的逐步加快,中国经济和对外贸易得到了迅猛发展,港口产业伴随
我国城市居住区正在面临从单一小区模式向多样化模式发展的趋势,同时居民对居住区园林环境的要求也在逐步提高。社区环境建设对社区文化建设十分重要。社区园林是社会文化的
构成地球上的生命体蛋白质有20种氨基酸,唯有甘氨酸没有手性,并且甘氨酸是最简单的氨基酸。研究甘氨酸对蛋白质结构和生物体手性的研究有重大意义。它在结晶状态上,有α、β
选择性激光烧结技术是快速成型方法中比较成熟的一种,由于其成型材料范围广、不需要夹具和模具等优点而受到国内外越来越多的关注。在选择性激光烧结制造零件过程中,温度是决
交通作为旅游活动六大要素(食、住、行、游、购、娱)重要组成部分之一,是实现将游客空间“位移”至旅游目的地目,完成旅游活动的必要条件,在旅游业中具有举足轻重的地位。贺
赋予法官对发生在法庭上的藐视法庭案件直接判决的权力,是维护法庭尊严和权威的需要。法庭上法官直判案件实际上是审判权对公诉权的分割的例外,过多适用必然会侵害公诉权,违背现
目的探讨慢性阻塞性肺疾病(COPD)患者心率变异性变化及其与肺功能的关系。方法选择2016年1月—2018年1月我院收治的60例COPD患者纳入研究,参考GOLD严重度分级标准将COPD患者
本文讨论了描述骨质 疏松的数学方法,分析了双能X光骨密度仪测量的骨密度参数的物理意义,找出了以骨密度为指标的骨质疏松诊断标准造成误诊与漏诊的原因,介绍了骨强度指标-抗
评估 COA的临床效果和对生理指标的影响。方法:高原现场大人群 COA及多指标测定对照研究。结果:COA对AHAD的预防和AHAD轻型的治疗效果显著;对初入高原人具有提高血氧饱和度、血液 C及Ald含量,增强心