【摘 要】
:
数据挖掘可以发现蕴藏在海量数据中的潜在知识,是当今最活跃的研究应用领域。关联规则是数据挖掘中的一个主要研究分支,侧重于寻找数据之间的依赖关系。关联规则挖掘的核心问
论文部分内容阅读
数据挖掘可以发现蕴藏在海量数据中的潜在知识,是当今最活跃的研究应用领域。关联规则是数据挖掘中的一个主要研究分支,侧重于寻找数据之间的依赖关系。关联规则挖掘的核心问题是如何提高挖掘算法的效率,以及如何更好的应用于特定领域中。中国传统医学是我国优秀的民族文化遗产,中医理论在长期的医疗实践中积累了大量数据信息,挖掘出其中蕴含的宝贵经验,是一项极有价值的研究工作。本文重点是对关联规则挖掘算法的研究,基于直接频繁闭超集改进算法的设计以及在中医药数据挖掘领域中的应用。论文研究的主要问题及相关成果如下:在算法研究方面,本文研究了频繁项集和频繁闭项集的挖掘算法。频繁项集的算法研究中,分析并实现了关联规则频繁项集挖掘的算法——Apriori算法和FP-growth算法。针对频繁项集挖掘效率低且数量大的问题,研究了频繁闭项集的挖掘算法,并引入直接频繁闭超集的概念,在CHARM算法的基础上,设计了一种能够快速检测候选频繁闭项集闭合性的改进算法——CIABD算法,最后在标准数据集上进行实验比较,表明了CIABD算法的快速有效性。在算法应用方面,利用中医疫病医案信息资源,经过数据预处理,分别采用关联规则中频繁项集与频繁闭项集算法进行中医药挖掘实验,发现频繁闭项集算法在中医药数据挖掘中相对更有优势。通过对关联规则结果的分析,表明挖掘的结果符合中医相关理论,具有较好的临床参考价值。
其他文献
自中国—东盟自由贸易区建成以来,广西作为连接东盟大市场的枢纽,发挥着重要战略作用,其作为中国与东盟国家间旅游交流的平台和桥梁的作用愈益突显。本文基于2005-2017年东盟
党内政治生态建设需要党内民主培育合格的主体、提供良好的制度保障和规范的程序。目前中国共产党党内政治生态建设面临着突出问题,主要体现为:部分党员干部理想信念淡薄,偏离
目的探讨护理干预对肿瘤手术患者的生活质量及疼痛程度的影响。方法选取2016年10月至2018年12月间西安市第九医院收治的行肿瘤手术的228例患者,根据采用的护理方式不同分组,
义务教育阶段初中生辍学问题是一个世界性难题,受到世界各国的广泛关注。目前我国对初中生辍学问题的研究主要集中在农村地区,并且形成了一套较为全面的关于辍学原因的分析思
文章以云南省元阳县箐口哈尼族村寨为例,分析该村寨的民族文化符号系统的构建,研究大众传媒是如何进入传统乡村社会并传播特定的文化符号,从而将少数民族乡村塑造为可被识别
采用辨证取穴针刺天枢、中脘、气海、太渊及耳穴神门、大肠等,治疗肥胖症68例,总有效率为94.1%。提示针灸减肥可对人体植物神经、内分泌、物质代谢、消化功能等起到调整作用。
投资与现金流的敏感性研究是近20年来,现代西方财务理论研究的热点之一。进入21世纪以来,国内学术界对企业投资行为也进行了研究,基本上是运用我国公司的数据对国外的某个假
<正> 中国畜牧史的分期问题,诸家有多种学术观点。本文试将中国农区畜牧史分为下列各个时期:即原始畜牧业时期、粗放畜牧业时期、家庭圈养畜牧业时期、家庭圈养和现代畜牧业
随着计算机网络技术和现场总线技术的发展,无人遥控潜水器的控制系统正面临着一场技术变革。传统的集中式控制系统将逐渐被分布式控制系统所取代。基于现场总线的分布式控制
目的分析舒胆片联合拉氧头孢钠治疗急性胆囊炎的临床效果。方法80例急性胆囊炎患者作为研究对象,采用随机数字表法分为研究组与对照组,各40例。对照组采用拉氧头孢钠治疗,研