【摘 要】
:
关联规则挖掘中最主要的工作是如何高效地挖掘频繁项集.目前在单机平台上,由于计算量大等原因,大数据集上的关联规则挖掘很难得到理想结果.在分析现有频繁项集挖掘算法的基础
【机 构】
:
安庆师范学院计算机与信息学院,南通大学计算机科学与技术学院
【基金项目】
:
本文受安徽省自然科学基金(070412061,10040606Q42),安庆师范学院青年科研基金项目(KJ201112)资助.
论文部分内容阅读
关联规则挖掘中最主要的工作是如何高效地挖掘频繁项集.目前在单机平台上,由于计算量大等原因,大数据集上的关联规则挖掘很难得到理想结果.在分析现有频繁项集挖掘算法的基础上,结合Eclat和dEclat挖掘算法优点,针对大数据集和片上多核共享内存计算环境,提出一种高效的并行频繁项集挖掘算法PEclat,算法实现了任务级并行挖掘频繁项集,并在大数据集上进行了多项测试.实验结果表明,无论数据稠密程度如何,该算法均能取得较好的性能.
其他文献
随着领域的规模性和复杂性不断增加,建立领域的概念模型往往超出了个人的能力.通过对群体智慧的聚集与组织,采用协同方法构建模型具有重要意义.基于社会性昆虫的群体协同机制
协同过滤是个性化推荐系统中应用较为成功与广泛的技术之一,影响协同过滤推荐质量的关键在于获取目标用户的k近邻用户,然后基于k近邻对其未评价的项目进行评分预测与推荐.针
目前对于高安全要求的内网环境,如何利用可信计算技术确保软件发布的安全与可靠具有重要的研究意义。由于软件可信发布具有动态性,即不同用户和平台对软件的要求不尽相同,而人为配置发布不仅效率低下而且无法确保其安全可靠,因此提出了一种用户、平台、软件之间相互选择的智能发布策略,其中的软件功能可信度算法可定量计算出软件功能符合用户需求的程度,智能匹配算法根据依赖关系生成安装序列以确保安装运行的顺利进行。同时为