基于分布式减法聚类的不完整数据填充算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:lhk4444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不完整数据填充是数据预处理领域重要研究课题.传统数据填充算法时间复杂度高,算法不具有分布式处理特性,不满足大数据环境下对数据快速处理的要求.提出一种基于分布式减法聚类的不完整数据填充算法,算法首先利用改进的减法聚类算法对整个数据集进行聚类.为了提高聚类算法的效率,利用云计算技术对聚类算法进行优化,实现基于多级MapReduce的分布式减法聚类算法.然后根据聚类结果和加权距离对缺失数据值进行填充,在保证数据填充精度的同时大幅度降低了填充过程的处理时间.实验结果表明,本文提出的方法能够对大数据进行快速聚类,同时有效保证缺失数据的填充精度.
其他文献
GPS定位系统是应用十分广泛的一种卫星定位系统,利用上空二十四颗卫星进行定位,适当接收需要的相关卫星信号,就可以得到高精度的时间和速度信息,给轮船、车辆导航系统提供了
针对话语分析中CDA与PDA的对立倾向、单向分析倾向及语篇选择性倾向,文章运用两者共现的新分析方法,以1993年至2016年美国国情咨文为语料,探讨两类(共三种)共现方式及其互补
<正> 美国审计制度经过近一个世纪的发展,在组织机构、审计方法、审计手段等方面日臻完善。考察、分析美国审计制度的特点,对我国审计体制的改革将具有借鉴意义。一、美国审
讨论和比较中医学的生命本原说与中国古代哲学的生命本原说。中医学认为人体生命源于父母之精,生命过程的维系依赖于一身之气。中国古代哲学认为人与宇宙万物的共同构成本原是
听、说、读、写是学习语言最基本的技能,接受过义务教育的大学生都有超过十年的学习英语的经历,虽然已经积累了一定量的英语词汇和一些基础的语法知识,具备了初步的英语阅读
以功能文体学理论为指导,从人际功能的角度着重对意识流小说的代表作之一《墙上的斑点》的人称、语气、时态、情态系统进行了分析,分析揭示了意识流小说的文体特点,有助于读
<正>一、寒潮的概念一般概念:寒潮是冬半年强冷空气入侵造成的剧烈降温,并伴有大风、冻灾、雨雪等天气。寒潮是强烈的冷高压活动,是我国冬半年重要灾害性天气过程。寒潮所到
受传统应试教育观念的影响,长期以来,高中英语教学都偏向于对学生英语知识技能的传授,虽然从短期来看确实有助于学生英语成绩的提高,但从长期来看,非常不利于学生专业素养和