数据挖掘中关联规则的研究与应用

被引量 : 0次 | 上传用户:guodlleon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是近年来数据库和人工智能领域研究的热点课题,它引起了科学界和产业界的广泛关注。作为一门交叉性学科,它涉及到机器学习、模式识别、归纳推理、统计学、数据库、数据可视化、高性能计算等多个领域。关联规则是数据挖掘研究中的一个重要的研究内容,它是完成数据挖掘任务的一个重要手段。在关联规则挖掘过程中存在两个问题:,一是产生大项目集;二是产生强关联规则。对于这两个问题,算法的复杂性是瓶颈,因为频繁集的数目和项目的数目成指数增长,所以导致在面对大规模的数据库时,整个算法的耗时巨大,从而最终导致挖掘算法在实际工程中的应用效果差。本文提出一种从大型数据库中挖掘关联规则的快速算法。该算法以经典的Apriori算法为基础,在分析研究已有各种优化算法的基础上,提出自适应步长和扫描树的概念,并采用修剪的方法对Apriori算法进行改进。理论分析表明,它比Apriori算法的应用效率高,实验结果也证实了这一点。在实际的关联规则挖掘中,大量的数据带有时态特性,所以往往需要在时态特性的前提下挖掘关联规则,然而即使是获得了时态关联规则,在实际应用中,仍然需要考虑某种约束条件,如利润约束,这样得到的关联规则才可以更加有效地为实际服务。本文针对实际应用中对于某种约束条件下应用的时态关联规则数据挖掘算法的需求,提出一种基于利润约束的有效生命周期内的时态关联规则挖掘算法(Constraint Temnoral FP-Growth:CT-FP-Growth)该算法根据已给的利润约束条件,在不同利润额度区域内,挖掘有效生命周期内的关联规则。以及有效时间区域,从而提高了数据挖掘的实际应用价值。理论分析与实验结果均表明该算法是合理有效的。最后,将其研究成果应用在医院病人治疗决策支持系统中,对五种同类型的药品进行治疗效果评比,最终结合决策树算法帮助医生制定出有效的医嘱。
其他文献
采用本体聚合方法合成了丙烯/1-丁烯无规共聚树脂,用DSC研究了丙烯/1-丁烯无规共聚物的等温结晶动力学。根据Avrami方程求出了各个结晶温度下的结晶动力学参数K(T)、n、t1/2以及样
目的研究频率为50Hz的不同强度正弦交变电磁场对体外培养成骨细胞(Osteoblasts,OB)的影响。方法原代培养大鼠颅骨成骨细胞,传代后随机分为9组,每组分别暴露在频率50Hz,磁场强
<正>抚今追昔,新华书店迎来了七十华诞。1937年4月24日新华书店诞生在革命圣地延安的清凉山下,如今书店已由初创时期只有几位老红军和一孔窑洞,发展成为今天拥有18万职工,总
本文采用定性与定量相结合的方法研究供应链效率中的若干问题。论文将供应链效率分为外部供应链效率与内部供应链效率。首先研究顾客满意与供应链效率之间的关系,将供应链中
道家思想是中国思想史上一个极其重要的学派,它以老庄思想为基本内核。老庄思想博大精深,意在探究宇宙之形成、万物之本源、人生之真谛。老庄哲学的魅力不仅在于它为人类的发
随着交流电弧炉、电气化铁路等不对称负荷的不断增加,电力系统三相不平衡问题日益严重。三相电压和电流的不对称不仅影响着电力系统的安全稳定运行,也降低了供电系统的电能质
高中英语教育是学生英语语言能力和终身英语学习能力培养的重要阶段。伴随着新课程改革进程的不断加快,如何进行课堂教学模式的创新,开展有效的课堂教学,以达到好的教学效果,
建立功能强大的影像数据库系统是组织和管理海量遥感影像数据的髙效手段。本文在对影像数据管理类型和开发方法分析后,在确定以VC开发基于Oracle的影像数据库基础上,讨论了影
<正>血管瘤是软组织中较常见的良性肿瘤。由大量新生血管所构成,约占软组织肿瘤的7%。位置表浅的血管瘤,如位于皮肤或皮下,临床上可根据其特征性皮肤颜色改变和查体多能明确