基于CSampling算法的分布式关联规则挖掘系统的研究与设计

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:liongliong591
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究的目标就是构造出一个能够运行于像INTERNET这样的低速不稳定网络环境下的分项式关联规则挖掘系统CSDARMS(CollectiveSamplingforDistributedAssociationRuleMiningSystem)。为了达到这一目的,提出了一种新的基于Sampling算法的分布式关联规则挖掘算法CSampling,同时给出了一系列基于该算法的优化措施,设计出了一个分布式关联规则挖掘系统CSDARMS。CSampling是一种基于样本收集机制的分布式关联规则挖掘算法,由于采用了不同于以往算法计数交换机制的样本收集机制,CSampling算法在网络传送效率上有了很大的提高。并且,给出了一种更优于Sampling算法的计算算法运行参数的方法,进一步确保了CSampling算法的效率。在新的CSampling算法中,算法运行时间也可得到大致的估计,保证了更好的用户友好性。提出了基于前序树的项集编码方式,系统中涉及到的项集数据结构都采用前序树的方式来编码,在内存中待挖掘的前序树与在磁盘上作为数据缓存的前序树采用不同的编码方式,以分别确保它们的高效挖掘与高效载入。提出了基于CORBA的分布式关联规则挖掘系统CSDARMS,给出了该系统的框架及实现方法。我们相信该系统能够健壮稳定地运行,具有良好的应用价值。
其他文献
本论文的主要工作是将数据仓库技术引入超市连锁店经营数据的分析,利用数据仓库建模、ETL、OLAP联机分析处理等技术,设计实现了一个基于数据仓库的决策支持系统,用以在大量的
本文按照软件工程的思想阐述了"电站锅炉一次风粉在线监测系统"的软件开发过程,从需求分析到总体设计、详细设计和编码实现,都直接利用软件工程的思想、概念和方法来解决实际
学位
IP网络中,IP地址与其关联的主机、所属网络、组织等建立了紧密的关联。随着网络的发展以及网络上不安全因素的越来越多,许多网络相关的工作都希望通过这种关联了解IP地址背后更
本文在Wyner的第一类窃听信道[1]和Ozarow的第二类窃听信道[2]的基础上,研究非DMC的窃听信道。K长的消息通过编码器编码成N> K的数据,并通过离散无记忆信道(DMC)发送给接收方。窃
本文结合东软工作流产品UniFlow,对工作流的相关知识以及当前的工作流应用做了简要介绍,然后从基于关系结构的工作流管理系统的总体介绍入手,详细讨论了其中接口系统的设计和实
本文主要讨论如何避免运行移动代理的机器(代理平台)对移动代理的攻击,即讨论如何才能使一个移动代理可以在一个恶意的代理平台下代替移动代理的拥有者进行签名且不暴露拥有者的
随着Internet的发展,电子政务正逐渐成为政府进行管理和服务的新模式,并逐渐渗透到政府活动的方方面面。政务活动向Internet平台全面迁移的迹象越来越明显,面对政务活动需要高效
Internet上的商务活动具有越来越复杂的快速集成异类系统的需求,因为不存在统一的标准,所以大量不同平台、软件和硬件的组合阻碍了这种需求的实现。Web服务正是一种满足于这
学位