基于演化算法的高效用项集挖掘算法研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:ad5260
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高效用项集挖掘(Mining High Utility Itemsets,简称HUIM)是数据挖掘(Data Mining,简称DM)和知识发现(Knowledge Discovery in Database,简称KDD)领域的重要课题。当数据集较大或者不同项的数量较多时,高效用项集挖掘就是一个NP问题。演化算法是经常被用来解决NP问题的方法之一。最近,一些基于演化算法挖掘高效用项集的算法被提出,比如HUPEumu-GARM、HUIM-PSO等。这些算法在时间方面比传统算法高效,但是需要多次遍历数据集;此外只能挖掘到较少的高效用项集。为了解决以上问题,现提出以下几个算法:1)提出了基于人工蜂群算法的高效用项集挖掘算法HUIM-ABC。运用人工蜂群算法(Artificial Bee Colony,简称ABC)挖掘高效用项集,运用位图表示数据集;二进制向量表示蜜源、三种蜜蜂和项集;运用PBVC和DNSG策略加快算法运行,PBVC用于检测项集是否合理,DNSG动态调整不合理项集。2)提出了基于生物启发计算的高效用项集挖掘框架Bio-HUIF。该算法将数据集表示成位图;个体用二进制向量来表示,并且用二进制向量xor的结果衡量个体之间的差异;提出改变gbest的策略。基于框架Bio-HUIF,实现了Bio-HUIF-GA、Bio-HUIF-PSO和Bio-HUIF-BA三个算法,并且在多个数据集上做了对比实验。3)提出了基于粒子群算法挖掘高平均效用项集算法HAUI-PSO和HAUI-PSOD。提出两种基于PSO的算法:HAUI-PSO和HAUI-PSOD,分别是基于标准PSO和框架Bio-HUIF;在多个数据集上进行了对比实验,表明两个算法效率较高。
其他文献
<正>作为伟大的无产阶级革命家、战略家、理论家,毛泽东一直非常重视建立水乳交融、血肉相连的党群、干群关系。他曾巧譬善喻地把党群关系比作"鱼水关系",语重心长,发人深省,
随着市场经济竞争变得越来越激烈,企业之间的竞争已经实质上转变成了企业人力资源配置方面的竞争。在新的信息化大环境下面,怎样使人才为企业所用,高效率地配置人才资源,已经
功率器件所用露铜框架的工艺重点在于焊料沾润性。文中通过主要不同焊料型号的沾润性试验,分析了不同焊料型号在露铜框架表面的沾润性差异,从而为露铜框架正确选用焊料型号提
<正> 鲁迅小说是每篇各具特色,绝不雷同的。《示众》更是格式特别,富于独创性。可以说是“画眼睛”、写“群象”的名篇。过去有人认为,这篇小说“描写一个罪犯在街头示众的场
期刊
随着社会的进步与科技的高速发展,现在已经进入了信息时代。在经济全球化的大背景下,企业之间的竞争也不断的扩大,将先进的信息技术用到企业的建设中就会提高企业的竞争力,对
随着生活水平的提高、全民健身意识的增强,健身工作室在近年间取得飞速发展,市场竞争也日趋激烈。各健身房需要通过提升自身管理,保持本机构的竞争实力,在市场竞争中立于不败
"有扶养关系"的继父母子女关系在法律上为拟制血亲,双方关系不能因继父母离婚而自然解除,相互间仍享有继承遗产的权利,但这种继承权属于附义务之继承权,需要重新审视与明确。
研究了一个域添加若干代数元后为该域的可离扩域的条件.并由此证明了可离扩域的一个性质.
房地产营销在开发企业经营管理的过程中处于核心地位。文章分析了当前国内房地产营销过程中存在的不足之处,然后根据这些不足制定了有针对性的改善措施,希望在此领域能够起到
<正>安眠药是临床上的常用药物,种类较多,以苯巴比妥、司可巴比妥(速可眠)、氯丙嗪、地西泮(安定)、奋乃静等最为常用。安眠药对中枢神经系统有抑制作用,少量服用可催眠,过量