【摘 要】
:
聚类分析是数据挖掘的一个重要研究方向,而PAM算法是聚类算法中一个重要的方法.本文针对PAM算法不适应大数据集的缺点,给出一个近似的线性时间聚类算法(ALCM),并且从理论上证
论文部分内容阅读
聚类分析是数据挖掘的一个重要研究方向,而PAM算法是聚类算法中一个重要的方法.本文针对PAM算法不适应大数据集的缺点,给出一个近似的线性时间聚类算法(ALCM),并且从理论上证明了该算法复杂度为关于数据集个数的线性时间复杂度.通过比较实验表明:1)随着数据个数的增大,PAM所花费的时间将激剧增大,而ALCM花费时间与数据集个数呈近似线性增长的关系,即ALCM是适应大数据集的.2)PAM算法和AL-CM算法随数据个数增大,二者的代价函数并无明显差异.
其他文献
目的:通过对2型糖尿病大鼠模型的糖化血红蛋白、超氧化物歧化酶(SOD)及丙二醛(MDA)等指标的观测,分析鬼针草对2型糖尿病大鼠模型的影响。
方法:选取检疫合格的SD大鼠55只
目的:观察坎离交泰汤治疗绝经前后诸证的临床疗效,以初步评价坎离交泰汤的临床有效性,为临床该方的使用提供科学依据。
方法:选择2007年5月至2008年9月,到西安市中医院妇科门
目的:通过经皮撬拨复位多枚克氏针内固定配合张力带夹板固定方法与切开复位内固定两种方法,比较两种治疗方法的疗效。
方法:选用60例符合跟骨关节内骨折临床诊断标准的患者
通过对矿山环境调查,分析研究了气候、化学介质、机械振动和冲击等对矿山机械作业的影响,提出了改善作业环境,提高使用可靠性和寿命的措施。
Through the investigation of