基于MapReduce的并行加权k近邻与离群检测

来源 :太原科技大学学报 | 被引量 : 0次 | 上传用户:cnjhhzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用MapReduce编程模型,提出一种并行的加权k近邻与离群检测方法WKNNOM-MR.该算法首先对输入数据随机均匀采样,在样本数据集中采用信息熵计算各个属性的权值;然后在集群中的数据节点上对输入数据进行加权,并将其映射到Z-order空间填充曲线,给出了一种基于Z-order的加权k近邻查询方法;根据每个对象与其加权k近邻之间的距离计算离群因子,在兼顾最小距离与平均距离的基础上,给出离群点检测算法;最后在具有5个节点的Hadoop集群上实现该算法,并采用人工合成数据集、UCI标准数据集进行实验,结果验
其他文献
本文采用问卷调查法等方法分析了体育专业就业情况和影响毕业生就业的主要因素。主要结论:2012-2014年苏北高校体育专业实际就业率逐年下降,就业形势不容乐观。体育专业毕业
目的探究老年高血压患者运用小剂量右旋美托咪啶治疗后对围麻醉期间血压产生的影响。方法选取我院进行麻醉手术的老年高血压患者80例,且均在2014年1月-2016年6月入院,依随机分
为寻找停放车辆的驶入特征与主路车流速度之间的变化规律,以路阻函数(BPR)模型为理论基础,以城市路外停车场出入口接入主路的最右侧车道为研究对象,通过实测数据分析,建立了无
目的:探讨微波+中西药雾化吸入方法对慢性咽炎患者进行治疗过程中,给予护理干预的临床价值。方法:选择东莞市常平医院2015年3月至2016年3月收治的慢性咽炎患者112例;分组依据
一、眼病患者:长期大量地食用大蒜会"伤肝损眼"。患有青光眼、白内障、结膜炎、麦粒肿、干眼症等眼病的人若长期大量地食用大蒜,会出现视力下降、耳鸣、头昏脑涨、记忆力减退
随着科学技术和计算机技术的高速发展,各行各业都将计算机技术引进到实际应用中去,提高了工作效率。在机械设计中也引进了计算机技术,其中应用较为普遍的是二维CAD技术,但是传统
为探讨冲压车间生产性噪声对作业工人健康的影响,于2003年对重庆市巴南区某轿车制造厂冲压机车间所有接触噪声的工人进行了职业健康检查,并对冲压车间作业场所进行了噪声监测
<正>外派监事会是国资监管和国有企业改革发展不可或缺的重要力量,是探索中国特色国有企业监管的一大创举,自成立以来,外派监事会在保障国有资产安全、推动国有企业健康发展
通过对碳热还原法合成SiC冶炼炉的复杂炉况进行数值模拟及实验,研究了单热源炉内气体流动的动态变化规律。研究表明,单热源炉内气体的流动呈现三维立体多向流规律,气体流动依
目的:考察前列泰浓缩丸的稳定性。方法:采用加速试验和室温长期观察试验考察其性状、鉴别、检查及含量测定项的变化。结果:样品经加速试验6个月、室温长期试验12个月的考察均无