基于双向搜索的关联规则挖掘算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:ananqiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是近年来数据库和人工智能等领域研究的热点课题,关联规则挖掘是数据挖掘的一个主要研究内容,研究高效的关联规则挖掘算法具有重要的现实意义。发现频繁项集是关联规则挖掘的关键步骤,其效率问题是关联规则挖掘过程的一大瓶颈,因此大多学者都主要对频繁项集问题进行研究。   本文在研究关联规则挖掘的基本理论和一些经典的关联规则挖掘算法,并对它们的特点进行了分析的基础上,主要对基于关联图的频繁项集挖掘算法进行了研究。首先,结合双向搜索策略对频繁项集的计算过程进行改进,在此基础上提出一种新的关联规则挖掘算法。新算法首先对频繁1-项集按支持度进行升序排列,然后在每次生成k-频繁项集Lk的同时,运用双向搜索策略验证其最大超集,并根据验证结果对Lk进行剪枝。其次,在该算法的基础上,将频繁项集问题转化为计算最大频繁项集问题,提出了一种新的基于关联图的最大频繁项集挖掘算法。最后,仿真实验结果表明,新算法在频繁项集维数较高时,可以有效减少候选项集的数量,算法的效率有所提高。
其他文献
网络技术的飞速发展,使得以软交换为核心的下一代网络成为目前国内外网络界研究的热点,各个高等院校通信类专业纷纷开设软交换相关的课程,为了使学生充分领悟和理解软交换的概念
测试是软件开发生命周期中关键的阶段,是保证软件质量的必不可少的手段。软件测试主要依靠选定和执行一组测试用例(称为测试套件),并通过观察被测系统的执行输出结果来尽可能
社会关系广泛存在于现实生活中,它们可以抽象成各式各样的社会网络。近些年来,研究者们发现社会网络中存在的社团结构是大规模网络分析和挖掘的基础,对于分析社会系统的组织
目前,基于内容的垃圾邮件过滤方法主要采用统计分析法,此类方法对垃圾邮件内容所表达的思想缺乏精准的定量描述,研究垃圾邮件内容所表达思想的描述形式对垃圾邮件的准确识别
自上世纪八十年代以来,织物变形的模拟仿真一直是计算机图形学领域内的一个研究热点。弹簧-质子模型因其原理简单,易于实现,在织物仿真中得到了比较广泛的应用,但是这种模型
现今互联网信息技术迅猛发展,似乎在一夜之间,大数据(Big Data)变成一个最流行的词汇。用户在利用搜索引擎便捷获取各类信息的同时,也面临着如何从海量数据中剔除那些影响信
互联网应用的蓬勃发展伴随了网络入侵的迅速增长。攻击的目标也逐渐由系统用户对象转入操作系统内核;这种攻击更难于发现和处理,给操作系统带来了巨大的破坏性。以内核rootkit
数据传输是各种类型的无线网络都必须关注的基本功能。在本论文中,我们重点关注两种类型的无线网络—无线传感器网络和无线双向中继网络—中的基于编码的无线数据传输。无线
传统的无线自组织网络通信中,组成无线自组织网络的中间节点主要负责接收相邻节点发送的数据信息,然后将接收的数据信息进行存储与转发。由于无线自组织网络通信具有不稳定性
服务业作为从事社会化、专业化服务生产的产业,在社会经济中扮演着越来越重要的角色,世界经济已经进入服务经济时代。将整个服务提供过程整合起来实施服务供应链管理,有助于准确