有效的不确定数据概率频繁项集挖掘算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:zhaoxiufen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对已有概率频繁项集挖掘算法采用模式增长的方式构建树时产生大量树节点,导致内存空间占用较大以及发现概率频繁项集效率低等问题,提出了改进的不确定数据频繁模式增长(PUFP-Growth)算法。该算法通过逐条读取不确定事务数据库中数据,构造类似频繁模式树(FP-Tree)的紧凑树结构,同时更新项头表中保存所有尾节点相同项集的期望值的动态数组。当所有事务数据插入到改进的不确定数据频繁模式树(PUFP-Tree)中以后,通过遍历数组得到所有的概率频繁项集。最后通过实验结果和理论分析表明:PUFP-Growth算法
其他文献
陶行知生活教育理论中“生活即教育”“社会即学校”“教学做舍一”三个方面的内容,体现了实践性、人民性和创造性的特点。它对思想政治理论课教学实践有以下启示:只有理论教学
研究高校创意写作教育教学体系是揭开二战后美国文学史神秘面纱的重要途径。出版于2009年的《创意写作的兴起:战后美国文学的"系统时代"》,是学者麦克格尔对战后美国文学史的
功能主义的翻译理论将关注点辐射到了原作以外的译作以及译语读者,突出了译者在调节原语作者和译语读者之间关系上所起到的不可忽视的作用。本文试图运用功能主义翻译理论中
SPSS软件是SPSS公司开发的专用统计软件,其良好的用户界面、强大的统计图表功能对制造企业进行质量管理的统计控制工作相当有益.该应用软件能够找出影响LF3l扬声器F0指标之关
以采自田间和广东省农业科学院果树研究所防虫隔离网室内嫁接并感染黄龙病的5个柑橘品种叶片为材料,以草本指示植物长春花( Catharanthus roseas)和木本指示植物椪柑(Citrus
指出文献〔1〕~〔8〕关于球磨机钢球的运动分析是错误的- 本文重新进行研究, 得出同以往结果完全不同的运动规律、分离条件和分离角计算方法 It is pointed out that the literat
针对现有蝴蝶识别研究中所用数据集蝴蝶种类偏少,且只含有蝴蝶标本照片、不含生态环境中蝴蝶照片的问题,发布了一个同时包含标本照片和生态照片的蝴蝶图像数据集,其中标本照
通过文献调查,发现当前图书馆满意度评价模型主要是基于SERVQUAL、LibQUAL+~(TM)、RodskiGroup、AHP以及ACSI模型进行构建的。从各模型的发展背景、量表指标的设置与权值设置
语言文字能力是听障学生社会性发展的重要素质之一。"能说""会写"体现了在语言文字能力上同健听者的"共性"要求。但是事实上听障学生书面语言能力的发展还有很大的差距,存在诸多严