【摘 要】
:
关联规则挖掘是数据挖掘领域的重要研究方向之一。频繁项集的挖掘是关联规则挖掘的第一步,也是最重要的步骤。FP-Growth(Frequent Pattern-Growth)算法因其挖掘效率以及空间
【机 构】
:
天津商业大学信息工程学院,河北工业大学人工智能与数据科学学院,河北省大数据计算重点实验室
【基金项目】
:
河北省科技计划项目(17210305D);天津市科技计划项目(15ZXHLGX00130,16ZXHLSF0023)
论文部分内容阅读
关联规则挖掘是数据挖掘领域的重要研究方向之一。频繁项集的挖掘是关联规则挖掘的第一步,也是最重要的步骤。FP-Growth(Frequent Pattern-Growth)算法因其挖掘效率以及空间复杂度方面的优势被广泛应用于频繁项集挖掘任务中。面对海量数据,FP-Growth算法挖掘效率变得极低甚至失效。在Hadoop大数据平台上实现的基于MapReduce框架的并行FP-Growth算法——PFP算法解决在处理大规模数据时传统算法失效的问题,但是由于其将每次执行之后的中间结果输出到磁盘,降低算法执行效率。
其他文献
<正>提高肉牛育肥效果,除需选择合适的品种和良好的体型外貌外,还应采取科学的饲养管理措施,以提高饲料转化效率和增重速度。1.选择合适牛群研究表明,选择1.5~2岁的架子牛,经
【正】前苏联教育家加里宁说:"教师的世界观,他的品行,他的生活,他对每一现象的态度都这样或那样地影响着全体学生。这往往是察觉不出来的。但还不止如此,可以大胆地说,如果
目的探索基层医院药品采购模式的改革。方法对某基层医院近3年药品招标采购和网络采购在价格、售后服务等方面进行比较与分析。结果招标采购明显降低价格,但同时售后服务质量
沉默权源自英国,已在诸多国家得到了广泛承认,主要分为明示的沉默权和默示的沉默权,沉默权制度有利有弊,但总体而言,利大于弊,这也是现今世界诸多国家认可沉默权的缘由所在。沉默权
单片机程序中,扫描程序按指令程序从主函数开始进行逐句运行,直到最后一句,若程序中没有死循环语句,则机器又从主函数main()开始运行直到结束,周而复始、以此循环,这给初学者
由于目前人口红利和投资红利的逐渐变化,“互联网+”是当今最具前景的发展通道。根据经济贸易的发展,以及贸易市场对跨境电子商务人才需求量的增加,对照目前跨境电商就业岗位
我们经常在各类报刊上看到这样的广告"贷款速办"、"个人消费贷款"、"个人贷款"、"无抵押担保信用卡贷款"、"高额信用贷款"及"无抵押贷款"、"10万元以内信用贷款".这些都是贷
摘要:图书和期刊的管理与建设,其目的是为了方便读者,更好地为读者服务,也是公共图书馆发展壮大的必由之路,它在一定意义上充分体现了图书馆价值。把图书和期刊管理建设好了,不但可
目的研究蛋白酶激活受体(Protease-activated receptors,PARs)在人脐静脉内皮细胞(Human umbil-ical vein endothelial cells,HUVECs)上的组成型表达。方法采用逆转录聚合酶链反
医疗服务设施通常采取集中、规模化的配置方式以提高医疗资源的利用率,但往往会降低偏远地区的可达性,导致该类地区的医疗资源供给不足。为了促进医疗资源进一步优化配置,需要基于现有医疗资源分布,开展准确、可靠的可达性分析,为医疗设施合理布局与优化,提高医疗资源的供给水平提供数据支撑。在可达性分析中,研究需求点到供给点的实际距离和时间、搜寻半径、距离权重等因素至关重要。两步移动搜寻法是目前常用的可达性分析方