【摘 要】
:
针对关联规则Apriori算法在信息爆炸时代面对海量数据时,其计算周期大、算法效率低等问题,将数据以特定的数据结构进行存储,降低数据遍历次数;在连接操作前进行剪枝操作,并且
【基金项目】
:
国家自然科学基金(41272374)
论文部分内容阅读
针对关联规则Apriori算法在信息爆炸时代面对海量数据时,其计算周期大、算法效率低等问题,将数据以特定的数据结构进行存储,降低数据遍历次数;在连接操作前进行剪枝操作,并且改变剪枝操作的判定条件;同时将改进算法IApriori与基于内存的大数据并行计算处理框架Apache Spark相结合,提出了一种基于Spark的Apriori改进算法(Spark+IAprior)。实验结果表明,Spark+IApriori算法在集群伸缩性和加速比方面都优于Apriori算法。
其他文献
综述了功能性营养型低度黄酒的特点及生产方式,着重对适宜研发的品种进行探讨,以为功能性营养型低度黄酒的研发提供参考,以达到优化黄酒营养结构、提升黄酒保健功能的目的。
目的:研究赶黄草中槲皮素的最佳提取条件.方法:采用水浴、超声水浴、渗漉、煎煮四种方法提取,正交试验进行优选,以高效液相法测定槲皮素含量,结果:赶黄草最佳提取条件为以浓度为50%的
目的:总结老年人腹腔镜胆囊切除术(LC)的经验,并探讨预防和减少老年人LC并发症的方法.方法:在全麻和CO2气腹状态下,老年人412例行LC术,中转剖腹手术5例,行胆囊大部分切除6例,
归纳建设工程监理内涵与特征;分析园林工程建设施工阶段工作特点;并从施工工序质量、工序活动质量、质量控制点设置以及工程质量的预控等方面,对园林工程建设施工阶段的监理规范
南宁市三津水厂工程规模为200000m3/d水源为邕江水.根据南宁市自来水公司水质检测资料:邕江原水浊度每年不同时段变化主要在3.00~629.30NTU之间,年平均浊度为75NTU,6~9月多年平
分析了影响填充墙体二次结构外观质量的因素,从填充墙砌筑、钢筋安装、模板安装、混凝土浇筑等方面,阐述了提高填充墙砌体二次结构外观质量的措施,并通过实例,验证了该措施的
萧红是活跃在三十年代文坛的东北籍女作家。在她短暂的31个年华的生命中,曾经拥有辉煌的事业。作为一个文学家,她是个胜利者。然而,作为一个女人,一个富有情感和智慧的知识女
教师角色观念与教学行为的变革是高校教学改革的先导,当前高等教育要超越“知识人”的培养,走向“整体人”的培养,唯有解构基于教育的科学主义理念支配的教师角色,建构基于全人教
目的探讨老年人腹腔镜手术治疗麻醉应该注意的问题。方法随机选取2011年4月至2012年4月我院收治的老年患者53例,均予全麻下行腹腔镜手术。麻醉前对患者进行全身状况的评估,对
金代银锭金代银锭的形制和南宋银锭相似,有官铸的,也有民铸的。官铸的铭文比较复杂,记有重量、用途,并有工匠和保铺、引领、校验者的姓名。民铸的铭文比较简单,记有重量以及