基于Cluster结构的并行关联规则挖掘算法研究和实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:chimaomao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库挖掘与并行处理技术互相渗透、互相结合,成为数据挖掘发展的重要特征,也是并行处理技术应用发展的一个重要方面.将并行处理技术与关联规则挖掘技术相结合,在研究了Cluster结构上的并行关联规则挖掘算法基础上,设计了PHR算法(Paralle Hybrid Recollection Algorithm)和PHR-G算法(Paralle Hybrid Recollection -Global Algorithm)两个并行关联规则挖掘算法,并在曙光3000进行设计实现和性能分析.PHR算法和PHR-G算法是基于Cluster体系结构设计的关联规则挖掘算法.算法采用了混合数据分布模式,有效地发挥了垂直和水平两种数据分布方式在不同迭代中效率;算法使用一定方法,通过记忆在k-1迭代后产生的全局信息,使k迭代中使用记载的全局信息,从而更高效地进行候选集操作和全局修剪,生成更小的候选集,减小消息传递量;PHR-G算法还按频繁集的等价类进行数据重划分,以利用数据垂直分布的本地计算性进行异步计算,消除了同步费用,提高算法的并行效率;在PHR-G算法的动态负载平衡策略中,实现在k>3的迭代中大颗粒负载平衡;并对算法进行了相关性能分析.
其他文献
数据挖掘是当前知识发现领域中的一个研究热点,本论文的主旨是研究如何通过基于粗集的值约简实现数据挖掘。值约简事实上是在求得属性简式的基础上,针对每条规则,将规则尽可能的
开放性骨折具有很大的危险性,一旦创口被污染将会出现肢体障碍、残疾,严重者会威胁生命.临床上对于开放性骨折患者以往给予钢板内固定治疗,该治疗方式容易发生感染,给患者造