【摘 要】
:
在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表
【机 构】
:
阜阳师范学院计算机与信息工程学院,中共阜阳市委党校信息管理中心
【基金项目】
:
安徽省重点研究基地项目(SK2012B625)资助, 安徽省专业综合改革试点项目(2013zy167), 阜阳师范学院专业综合改革试点项目(2013ZYSD05)
论文部分内容阅读
在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。
其他文献
这是一个十分诱人的市场。 这也是一个充满陷阱的市场。 中国日化业,这个最早与外资短兵相接的行业,如今正踌躇满志地迎来它的二度辉煌。当好迪、拉芳、蒂花之秀等企业在电视
刻画了半完全环上的投射模,同时得到了关于半完全环上投射模的一些结果,如R是一个半完全环,那么每一个投射左R-模的任一不可分解的分解补极大直和项:每个有限生成的投射左R-模
2015年年尾,听到两则关于房子的闲事。一则是有人在湖东的天地源七里香订了套房,为改善居住条件。3月的时候想想不合适,托人千方百计把房退了。就在这一年,那里的房价由1月16000
分析了加权马氏距离判别分析中的权值问题,提出了用熵理论来确定加权马氏距离中权值的方法。实证分析显示基于熵理论的加权马氏距离要优于基于主成分的加权马氏距离。
<正> 11月26日,中国网通成立两周年庆典,中国大饭店,中科院院长路甬祥,《第三次浪潮》作者、著名未来学家托夫勒,北京大学教授周其仁,还有杨元庆、杨澜、潘石屹等名人共同出
一个群体形成一个社会阶层需要各方面的因素,其中外界尤其是媒体的呼吁必不可少。中国CIO群体日渐活跃在中国的企业建设中并必将逐渐显现其重要性。 企业作为一个国家经济面
<正>胡锦涛同志在党的十八大报告中指出:要"牢牢掌握意识形态工作领导权和主导权,坚持正确导向,提高引导能力,壮大主流思想舆论。"这与2003年12月他在全国宣传工作会议上讲话
中国不少世界级名校,许多大学是由基督教或天主教会创办的。不过,在1952年中国院校大调整中,这些教会大学也集体消失了。时间过去半个多世纪,它们,还能被人记起吗?
针对目前商品化单片机实验箱所存在的弊端,自主研发设计了模块化单片机实验教学仪器,在此基础上,提出了从单片机实验教学仪器、实验教学实施和实验教学拓展三个方面改进单片机实
<正> 8月8日中新网发布消息说,中国银监会主席刘明康已致信巴塞尔银行监管委员会主席卡如纳先生,表示至少在“十国集团”2006年实施新巴塞尔协议的几年后,中国才考虑实施新协