利用数据变换与并行运算的闭频繁项集挖掘方法

来源 :湘潭大学自然科学学报 | 被引量 : 0次 | 上传用户:hngyssh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统闭频繁项集(CFI)挖掘方法耗时长、效率低的问题,提出一种基于数据变换与并行运算(DTPC)的新型挖掘方法:设计基于质数对数运算的数据变换方法,将大量数据转换成简单的数字;利用Spark并行框架中的平方/开方运算将这些数字转换成频繁项集.3 000万篇文章的大数据集实验结果表明,提出的DTPC算法可以大幅度提升数据挖掘效率,同时减少计算资源的不必要浪费.
其他文献
空管不安全事件的发生是由多方面因素造成的,其中环境是一个重要的诱发因素.文章对空管不安全事件诱发因素中的环境因素进行归纳,构建环境因素评估指标体系,通过管制工作一线
研究了含初始几何缺陷的复合材料层合圆柱曲板在轴向压力作用下的蠕变损伤行为.基于Timoshenko-Midlin板理论和Boltzmann线性叠加原理,建立了含初始几何缺陷的复合材料正交铺
针对馆藏铜鼓本体记录上的不足,将多基线近景摄影测量技术应用于馆藏铜鼓数字化及铜鼓保护领域.采用多基线交向摄影方式获取大重叠度的序列影像,通过多基线立体匹配、多光束交会和区域网平差等方法实现特征点匹配和多光束立体定位,提高铜鼓表面点云数据的可靠性与精度.实验表明,该方法操作简便、快速高效,满足馆藏文物精细建模的要求.
针对常德纺织机械有限公司生产的YJ2-142-02摇架手柄冲压中存在的问题进行了分析,采用有限元法建立了分析模型,用AutoForm进行了模拟计算。并提出了改进措施.通过工艺试验验证了
通过"富者愈富"模型,分析"看病难"问题;通过"舍本逐末"模型,分析"看病贵"问题。在此基础上,对构建云南省医疗服务网络组织的三种最具代表性的驱动因素——资源驱动、竞争战略
提出了一种基于正六边形线阵CCD探测器的运动目标探测系统.系统不仅可以实现360°范围内环形视场探测,还可以实时显示运动目标的位置及角速度信息,达到搜索跟踪的目的.在硬件
多目标跟踪技术已经发展了50多年,该技术可分为传统多目标跟踪方法和新兴的多目标跟踪方法,本文基于对传统高斯混合概率假设密度滤波算法的研究,将自适应新生目标概率密度函
Henry反应,又称为nitroaldol反应,是一个经典的人名反应;是有机合成中一类重要的碳碳键构建反应;是亲核试剂硝基烷烃对亲电试剂羰基化合物加成的反应。Henry反应的产物β-硝基
以三氯化锑(SbCl3)和硫(S)粉为反应物、硼氢化钠(NaBH4)作还原剂及乙二醇(EG)为辅助溶剂,用水热法合成了四棱柱状的Sb2S3纳米棒.所得产品用XRD、EDS、SEM、TEM、HRTEM、SAED以及UV-Vi
本雷达信号处理系统主要用于交通车辆的测速、测距。文中分析了信号处理的硬件设计,算法流程设计和信号处理整体设计以及信号处理工作流程。信号处理具有体积小、价格低等优