基于MapReduce的FCM聚类集成算法

来源 :计算机应用研究 | 被引量 : 3次 | 上传用户:hao8035
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊C-均值(FCM)聚类集成算法是一种利用集成思想提高聚类质量的方法。针对FCM聚类集成算法随着数据量的增加时间复杂度过高的问题,提出一种基于MapReduce框架的并行FCM聚类集成算法。首先利用多组随机的初始聚类中心分别进行聚类来获取具有差异化的聚类成员;然后通过建立聚类成员簇间OVERLAP矩阵来寻找逻辑等价簇,统一所有聚类成员中的簇标记;最后利用投票法共享聚类成员中数据对象的聚类情况得出最终的聚类结果。实验结果表明,该算法具有良好的精确度、加速比和扩展性,具有处理较大规模数据集的能力。
其他文献
本文用扫描电镜和透射电镜对70株患者痰中分离的铜绿假单胞菌临界点干燥,超薄切片和负染标本进行了超微结构观察。发现菌细胞一端只有单一鞭毛,长约530nm,呈中空管状。有47/70的菌细胞壁外层
我院1985-1996年共收治体表恶怀肿瘤11例,其中恶性纤维组织细胞瘤4例,脂肪肉瘤2例,平滑肌肉瘤2例,滑膜肉瘤及纤维肉瘤各1例,隆突怀皮肤纤维瘤1例。对诊断及治疗问题进行了讨论。认为诊断确定后应根
京郊农村的四件新鲜事: 程控电话大棚拽 黄瓜生菜上名片 农民种菜办执照 卖菜都给开发票
研究多属性社交网络节点重要性排序问题。已有的多属性排序法基于主观赋权,在研究者对某数据集或者是某社交领域并不是很熟悉的情况下,主观赋权容易出现偏差。针对这点提出在对
一特重度烧伤病人死亡原因分析张剑姜宇禄罗旭松岑瑛林俸刚华西医科大学附属第一医院整形烧伤科1病例资料患者女性,15岁,因在密闭房间全身大面积火焰烧伤后40分钟入院。查:脉搏:98次/分
针对微博热点话题检测使用主题模型只能提取出无序话题词组合的问题,提出一种结合词激活力模型与主题模型各自优点的微博热点话题检测方法及话题关键词的计算方法。使用传统
为探讨小儿髋关节内压力与不同体位的关系,作者对20个小儿尸体髋关节压力进行了测定。结果发现:关节内压力主要取决于髋关节体位,伸直极度外展内旋位压力最高,为3.46±0.64kPa,屈曲45°外
本文对7例根尖肉芽肿5例根尖囊肿进行了病理及免疫组化研究。结果显示该二种病变均以炎性肉芽组织为其主要组织结构。浸润之慢炎细胞都以淋巴细胞为主,另有一定量浆细胞及巨噬细
对术后半年~7年的68耳分泌性中耳炎进行追踪观察,并对术及疗效进行分析,结果显示术前声导抗检查68耳均为B型曲线,术后检查A型51耳,B型9耳,C型3耳,鼓膜穿孔5耳。术前纯音测听34耳,语言频率平均提高10~20db。11耳
针对已有的动态优化算法求解高维动态背包问题(DKP)难以获得高质量的可行解,且跟踪环境速度慢,提出了一种修补二进制差分进化算法(BDE/R)用于求解高维DKP。在BDE/R设计中,一种随机