【摘 要】
:
传统的k-means算法不论其数据样本的分布情况,将簇边缘位置、簇中心位置、离群点的数据样本全部按照最小距离原则,划分到离它最近的聚类中心所在簇中,没有考虑数据样本与其他
【基金项目】
:
天津市自然科学基金重点项目(13jczdjc34400);河北省科技计划项目(17214304D);天津市科技重大专项(14ZCDZGX00818)资助
论文部分内容阅读
传统的k-means算法不论其数据样本的分布情况,将簇边缘位置、簇中心位置、离群点的数据样本全部按照最小距离原则,划分到离它最近的聚类中心所在簇中,没有考虑数据样本与其他簇之间的关系。如果数据样本与另一簇中心的距离接近于最小距离,则此数据样本与两个簇的关系都很大,显然这样直接划分并不合理。针对此问题,文中提出了最近邻优化的k-means聚类算法。运用近邻的思想,将这些不“很属于”某簇的数据样本划分到其最近邻数据样本所在的簇中,实验结果表明,这种最近邻优化的k-means聚类算法有效地减少了算法的迭代次数,
其他文献
[目的]观察涤痰化瘀法治疗中晚期食道癌临床疗效。[方法]治疗组30例采用涤痰化瘀中药,对照组30例采用复方天仙胶囊。[结果]两组临床症状改善状况、生存质量提高率均有显著差异
目的探讨健康教育对农村糖尿病患者遵医行为及血糖的影响。方法对本科收治的80例农村糖尿病患者实施系统的健康教育,内容包括糖尿病知识、饮食指导、运动指导、自我监测等,并强
摘要在不要求函数在区间连续的假设下,研究了其反函数存在的条件及其在一点的连续和可微的条件,给出了反函数在一点连续的本质刘画.主要结论是原函数在案点连续不是其反函数在相
在发展农畜产品加工业的过程中,内蒙古自治区紧紧围绕市场需求,着力推动产业聚集、产业延伸、产业升级,走名牌带动、集群发展、技术进步、产业提升的路子,农畜产品加工业技术创新
[目的:探讨血红素氧化酶(HO)-1启动子区STR.SNP联合多态性与原发性高血压易感性间的关联。方法:用毛细管电泳与直接测序法对139例原发性高血压者(病例组)及101例对照个体(对照组)的HO-
目的探讨1,25-二羟维生素D_3[1,25(OH)_2D_3]对人白血病6T-CEM细胞株凋亡及维生素D受体(VDR)蛋白表达的影响。方法培养6T-CEM细胞株,采用随机数字表法将其分为A、B、C、D四组
以气、阴阳平衡学说、五行学说等角度为切入点,从整体观方面揭示乙肝病毒变异后的发病本质,挖掘温补正气法指导乙肝病毒变异后的补救治疗意义,指出本病以变异且活跃的乙肝病
培训是每一个企业发展道路上不可忽视的一块巨石。培训是企业健康发展的需要,是提高企业管理效率的手段,是企业人格魅力的关键体现,企业员工培训旨在营造良好的企业文化氛围。本
作为一个复杂的动态系统,小说修辞交流横向轴与纵向轴各个要素之间的关系总是随着历史语境的演变而演变.社会文化的历史发展,可能改变一个时代的思维模式,进而改变读者与作者