【摘 要】
:
根据大数据的特征即数据量大、维数高,本文提出了基于大数据的高效分布式离群点检测算法。该种算法就是在数据处理的初级阶段,根据计算距离的方法将数据进行精确的计算,并在
论文部分内容阅读
根据大数据的特征即数据量大、维数高,本文提出了基于大数据的高效分布式离群点检测算法。该种算法就是在数据处理的初级阶段,根据计算距离的方法将数据进行精确的计算,并在计算的过程中建立查询检测模型,通过模型将数据进行二次检测;进入离群点检测的阶段,通过大数据模型对其结果进行批量的过滤。最后,就在基于距离的数据与局部数据集验证相结合的方式去检验大数据的实效性与精确度。实验结果表明,与现有算法相对比,基于距离的算法在一定程度上大大提高了计算的精确率。
其他文献
物联网已广泛应用于智能家居、智能交通、营区管理、环境监测、物流快递、食品溯源、工业监测和健康护理等领域,为提高物联网应用效率和打造物联网应用生态环境,亟需一种以公
目的对比手法整复小夹板固定与石膏外固定治疗桡骨远端骨折的临床疗效。方法选择2015年9月~2017年9月我院骨科收治的桡骨远端骨折患者60例,随机分成小夹板组与石膏外固定组,
林业资源是我国自然资源中的重要组成部分,对国民经济建和生态环境保护有着非常重要的作用。林业生产与生态环境建设是目前林业行业发展过程中比较重要的问题,如何协调林业资
根据棕榈生产发展的子计划,安哥拉计划将在未来五年内,投资141亿宽扎用于种植安哥拉棕榈树。实际上,在非洲棕榈油产业持续增长的市场前景下,安哥拉正加大对棕榈油产业的投资力度
由于橡胶价格低而使胶农缩减橡胶产量,12月,印度天然橡胶进口量为3.7万t,同比提高了8%。而产量为5.8万t,下降了7.9%。天然橡胶消费量为8.4万t,印度进口橡胶的国家主要是印尼
随着科学技术在畜牧养殖业中的应用,畜牧养殖逐渐趋向于集约化、规模化以及产业化发展。在这样的发展背景下,畜牧动物防疫工作被提上日程。抗体检测血样采集作为防疫工作的重
作为世界第二大石油资源消耗国,我国的石油需求量和消耗量在逐年攀升。而在石油的开采、储运、炼制等过程中,不可避免地会产生含油固体废弃物,即含油污泥。据统计,我国每年产
<正>到2020年,中国老年人口将达到2.48亿,老龄化水平将达到17.17%〔1〕。中国特有的"421式"家庭结构,子女大多因工作忙碌而无暇照顾老人,空巢老人的数量在不断增加,而社区养
目的分析微生物检验在尿路感染患者预防和诊断治疗中的临床价值。方法对我院2017年9月-2019年1月接诊的130例尿路感染患者进行观察,取全部患者清洁中段尿继续观察,并采用随机
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技