数据挖掘中关联规则算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sttyuanchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,社会发展日新月异,全球性的网络化、信息化进程正在改变着人们的生活,同时也给企业的经营方式带来了深刻的影响.在市场竞争日益激烈,不可预测因素逐渐增多的环境中,企业必须借助先进的计算机和信息技术,提高自身运作的效率,才能在激烈的竞争中取得优势。因此决策支持系统得到了广泛的应用,作为决策支持系统的基础的数据挖掘技术和数据集市技术也得到了广泛的发展。 数据挖掘是当今国际上人工智能和数据库研究方面最富活力的新兴领域,其目标是为了满足用户目标,自动处理大量的原始数据,从中识别重要和有意义的模式,并将其作为知识加以表达。是从大量的数据中发现潜在的、有用的知识的过程,是解决“数据丰富,信息贫乏”的有效方法。关联规则是数据挖掘最重要的课题之一。 Apriori算法是关联规则挖掘的主要算法之一,但是由于要多次扫描海量数据库,算法的执行时间会很长。本文在超市实际销售数据的基础上建立小型数据集市,提出了基于临时表的规模压缩挖掘算法。在程序实现Apriori算法和基于临时表的规模压缩挖掘算法后,应用于建立的数据集市,并将结果进行比较,从而得出结论。基于临时表的规模压缩挖掘算法采用及时删除数据库中无用的事务记录的方法减少了事务数据的数量,大大加快了算法的执行效率。它能够生成较小规模的频繁候选集,即利用了非频繁模式的父模式必定是非频繁模式的原理,有效减少了生成的后选集的规模,实现方便,在很大程度上也提高了效率。 本文提出的算法主要有以下优点:1)效率较高。与现在已有的Apriori算法相比较,大大减少了算法须对数据库的遍历次数和扫描记录数。2)易于实现。由于是利用临时表来操作,在PowerBuilder强大的数据库操作功能帮助下,易于实现该算法。
其他文献
几十年来,研究者通过对语言学习策略的多方面研究,发现了许多对其选择产生影响的因素,如动机,情感,性格等。性格因素日益引起研究者的重视。然而,国内外对性格与英语学习能力关系的研究尚未得出统一的结论,对性格与学习策略的研究结果也未明确表明性格对学习策略的选择具有何种影响。本研究重在说明性格类型(从内外向角度)对英语口语学习能力及策略使用的影响与其之间的关系。  本研究以Eysenck人格理论和Oxfo
学位
艾德里安娜?里奇(1929-2012)是美国重要的女性主义诗人、批评家和散文家。她丰富多产的作品在文学界广受赞誉,这一点恰恰说明了她不仅是一位卓越的美国诗人,更是哈罗德?布鲁姆误读理论下的“强劲诗人”。位列“强劲诗人”之一意味着无论是在诗歌技艺上还是思想深度上,相对于前辈而言里奇都有很大的突破。那么问题的关键在于:里奇是如何获得心理和美学上的双重权威的?诗集《狂野的耐心带我远行》是里奇历经四年的呕
学位
Lonely Guy(LOG)proteins are important enzymes in cellular organisms.They catalyze the final step in the production of biological active cytokinin via dephosphoribosylation reaction.LOGs are vital enzy
学位
太阳能热发电是可再生能源发电中最有前途的发电方式之一,目前正引起世界许多国家的关注。传热技术是太阳能热发电关键技术。目前,太阳能热发电传热技术中熔融盐传热技术是一种先进的技术,它可用于槽式和塔式太阳能热发电系统。尽管国外已经有熔融盐传热蓄热的试验系统或试验电站,但对于熔融盐传热特性的理论研究还是非常缺乏的。本课题成功建立一套用于研究熔融盐对流换热特性的实验台,实验台解决了熔融盐高温、腐蚀性、毒性等
烟气脱硫工艺中,喷雾干燥法是目前应用比较广泛的半干法烟气脱硫技术。它既有湿法脱硫反应速度快、脱硫效率高的特点,又有干法无污水废酸排出,脱硫后产物易于处理的好处,广泛适用于中小型电厂及垃圾焚烧电厂。然而目前半干法结合常规除尘器对亚微米级的细颗粒脱除效果不好,处理捧放的烟气仍有大量的PM10进入空气中。可吸入颗粒物(PM10)由于其粒径小、数量多、重量轻、比表面积大,极易吸附多种有毒有害物质,且在大气
直接序列扩频MSK通信系统(简称DSSS-MSK系统),拥有扩频通信系统所具有的抗干扰性能强、保密性高的优势,兼具MSK信号包络恒定、能量集中、频谱利用率高以及对非线性失真不敏感的特点,在卫星通信、雷达宽带数据传输、导弹指令传输等领域得到了广泛应用。随着高速移动通信环境的应用需求日益增加,开展高动态下直扩MSK全数字解扩接收机的同步算法研究具有重要的理论意义和应用价值。  本文分析了直扩MSK信号
直接序列扩频通信系统具有抗干扰性能强、截获率低的特点,广泛应用于电子对抗、导航以及保密通信等军事领域。在高动态环境中,由于载体机动引起很大的多普勒频移和多普勒变化率,给扩频信号的捕获和跟踪带来困难。随着高速移动通信环境的应用需求日益增加,开展高动态环境下扩频信号的快速捕获算法研究具有重要的理论意义和应用价值。  本文首先介绍直扩信号捕获的经典算法—匹配滤波方法,分析了多普勒频偏对伪码捕获的影响,利
无线测向问题可以追溯到无线通信的起始阶段,由于其在通信、雷达、声呐、导航等方面的应用而引起了学术与工业界的广泛关注。自二十世纪初以来,高频环境下信号产生器和信号放大器的显著发展极大地扩展了到达角(Direction of arrival, DOA)估计系统的能力和适用性。随着大规模多输入多输出(Multiple-input multiple-output, MIMO)系统出现,全数字结构具有电路成
联盟博弈(coalitional games)一直是多agent系统(multi-agent systems,MAS)和人工智能领域的一个非常重要和活跃的方向。究其原因,联盟提供了一种灵活的协作方式,让一些独立的agent在一定时间内结成一个协作团队,相互联合起来实现优势互补和资源共享,从而能够更加智慧、灵活和高效的完成目标。然而,现有研究大都局限于确定性环境,需要预先给出每个agent拥有的能力
学位
无线数据汇聚网络(WSNs,Ad hoc,Mesh,et al)作为一类新兴的、极具特色和发展前景的无线网络技术,正逐步在国民经济和社会生活的各个领域得到了广泛的应用,同时也成为学术界研究的热点领域。在无线数据汇聚网络中,如何进行多信道和TDMA时隙等网络资源的调度,从而最大化网络监测质量,最小化网络冲突,最优化网络数据汇聚性能是一个重要的研究课题。该文全面总结了该领域的理论和技术现状,重点研究了