MapReduce模型下的模糊C均值算法研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:liubingonline
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对模糊C均值算法需要不断迭代来计算样本数据的隶属度值以及聚类中心的特点,利用MapReduce模型解决海量数据下的模糊C均值问题,进而提出高效的模糊C均值算法。在Map阶段和Reduce阶段分别完成隶属度和聚类中心的计算,每次迭代都需要启动一次完整的MapReduce执行过程。通过多次迭代计算出隶属度值以及聚类中心,并更新聚类中心文件,供下一轮作业使用,重复执行这一过程直至得到最终聚类结果。实验结果表明,该算法能够有效减少MapReduce计算过程中的迭代次数,从而提高整体执行效率。
其他文献
利用地基GPS气象学技术,对南极地区的气象进行研究,比较了GPS/PWV和用探空方式得到的Radio/PWV,画出了两者的PWV时间序列图,显示具有较好的一致性,验证了GPS遥感大气的精度和准确性,为以后南极气象研究提供参考。
针对位置服务应用中,基于道路网络的移动对象连续K最近邻( CKNN )查询实时响应速度慢的问题,提出基于方向关系约束的移动对象CKNN查询算法CDR-CKNN。采用锥形模型建立方向关系表
针对现有嵌入式系统最坏执行时间(WCET)的静态分析方法效率低下问题,利用最小传播算法对程序流进行分析,获得程序中每一个基本块的最小树约束,通过象征性循环上界约束对所求函
针对密码算法用户对于多种对称密钥算法高效可配的使用需求,设计一种新的对称密钥算法硬件架构。根据各密钥算法的特点,分析其运算逻辑并进行拆分,使用基础运算单元可重构方法将
分布式文本检索系统难以兼顾高效率的数据检索和低成本的索引维护。为此,提出一种基于计数型布隆过滤器的文本检索模型CBFTRM。该模型将物理节点分为数据节点和索引节点,分别采