【摘 要】
:
由于以下原因,原有的集中式数据挖掘越来越不适应新的需求:1)待处理的数据源是分布式存放在网络的不同主机上的。2)于网络带宽的限制、数据的私有性和安全性、系统的不兼容性
论文部分内容阅读
由于以下原因,原有的集中式数据挖掘越来越不适应新的需求:1)待处理的数据源是分布式存放在网络的不同主机上的。2)于网络带宽的限制、数据的私有性和安全性、系统的不兼容性等原因,把所有数据源集到一个集中的地方(如数据仓库)进行集中数据挖掘往往是不现实的。3)对挖掘系统的开放性和易用性的要求越来越高。分布式数据挖掘技术就是为了解决上述问题而被提出的。目前,该研究领域的两个重要问题式设计合适的分布式数据挖掘系统的体系结构和相应的分布式挖掘算法。本文将最新的分布式组件技术——Web服务技术引入分布式数据挖掘领域,在解决上述两个问题方面做了一些尝试。首先介绍了分布式数据挖掘产生的背景、研究现状和成果、存在的问题以及关联规则挖掘的不同算法。接着介绍了Web服务及其相关技以及Web服务技术的优点和其适用场合,给出了Web服务技术与分布式数据挖掘的结合点。然后提出了一种跨平台的,易扩展的,适用于分布环境下的基于Web服务的分布式数据挖掘系统架构。并结合上述系统的特点,给出一个该系统中的分布式关联规则挖掘算法FDM-GS(FDM with global site)。该算法应用了新的候选集剪枝策略,可有效减小候选集的规模和收集候选集支持计数时的网络信息流量。并结合一个实例对该算法做了详细的说明。
其他文献
当周王室东迁,京畿之地的贵族重臣埋下祖传重宝纷纷逃跑的时候,秦襄公却出兵勤王,秦人义无反顾地承担了保卫西部边疆的历史责任。早期秦国崛起的历史证明,虽然国家的政治、经济、
农业可持续发展是整个国民经济和社会可持续发展的基础。可持续农业是当今世界农业发展的主导方向,它不仅可以实现农业经济的良性循环,而且可以维护生态系统的平衡。作为区域可持续发展的重要内容,实现农业可持续发展有助于促进区域人口、资源、环境、经济以及社会的协调发展。本文以遂宁市为例,对水土流失区域农业可持续发展的问题作了初步探讨。可持续农业是一种良性循环的农业生态——经济——社会复合系统,基本原则是 综合
嬴秦,是从周孝王封非子于秦叫起来的,秦在当时为附庸,还算不上一个方国.直到周平王封秦襄公为诸侯,秦才开始以方国的面目出现.这个建立了嬴姓方国的秦族起源于何地?学术界若
筛选利用自然存在于果蔬表面的生防酵母菌作为生物防治的菌株来控制果蔬的采后病害是一种对生态环境友好的防治方法。基于拮抗酵母的生物防治产品无论是处于研发阶段或已处于
在中国历史上,秦人第一次统一了全国,为以后两千多年的封建王朝奠定了一个建构模式,可谓意义重大.大量传世文献、考古成果与文化遗存证明,秦人发祥于陇南、天水一带的陇右地区
随着计算机科学技术飞速发展,拱坝稳定分析的手段也越来越多样化,而拱坝坝肩稳定是拱坝稳定重要前提,因而它也就成为一个重要的研究课题。本文对拱坝坝肩稳定分析方法进行概述,较
辽阳型日光温室结构特殊,由镀锌钢架和草墙组装而成,代替了传统日光温室的厚土墙,提高了土地利用率,不破坏耕作层,利于作物生长。现通过对辽阳型与白银型日光温室2012年和201
关于华夏文明的形成,涉及甘肃地区.笔者想就此谈两点想法.文献记载,西羌从西汉始即向东迁移,故称东羌.这里的东迁,在汉代是指由非郡县区迁至郡县区.其实羌人东迁不始于西汉,
混凝土徐变非常复杂,不仅与时间有关,还与应力历史有关,加上现代混凝土在材料组成、生产施工工艺及应用结构形式等方面的诸多变化,混凝土的徐变现象还远没有被完全掌握。到目前为