关联分析在中医数据挖掘中的应用研究

被引量 : 0次 | 上传用户:dldx05444011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国中医学是人类知识宝库的重要组成部分。中医学在漫长的发展过程中,形成了自己独特的“辩证论治”理念。然而,长期以来计算机对中医信息分析处理基本上仍处于浅层的、经验性的知识应用,难以对中医的诊断和治疗过程给出合理的解释。数据挖掘指的是从大量数据中提取出有效的、新颖的、潜在有用的,以及最终可理解的模式的高级过程。关联分析是数据挖掘研究的一个十分重要的方面。关联规则挖掘侧重于确定数据中不同领域之间的关系,找出满足给定条件下的多个域间的依赖关系。使用关联规则挖掘方法,分析中医诊疗数据,可以挖掘出中医学在诊断和治疗中的潜在知识。本论文基于北京市科技计划项目《中风病个体诊疗规律及综合治疗方案的研究》,以中风病诊疗为背景,借助课题前期开发的管理信息系统的数据,挖掘中医对中风病的诊断和治疗的规律、方法等知识,为建立中医上可行的演绎知识体系提供支持。本文的工作主要有以下几点:(1)分析课题背景,确定研究目标,提出4个需解决的主要问题。(2)在对数据挖掘进行简要综述的基础上,重点研究了关联挖掘方法。介绍了关联挖掘中基于Apriori算法和FP-growth算法的频繁项集挖掘过程,同时针对中医诊疗知识发现这一复杂特殊的多层多维数值类型的关联挖掘问题,分别介绍了多层关联规则、多维关联规则、数量关联规则的具体挖掘方法。(3)根据中医诊疗数据的特征,提出了一整套数据预处理方法,结合数据清理、集成、变换和归约等技术对中医原始数据进行了规范化处理。(4)在研究过程中,成功地完成了从数据预处理(仅数值型数据离散化部分)到关联挖掘(基于Apriori)以及规则显示整个流程的MATLAB程序。同时,针对频繁项集过多的问题,提出在FP-growth基础上进行改进的关键项抽取算法KEFP-growth,忽略了在分析时不关心的频繁项集,并使用VC++语言进行了算法实现,达到了较好的挖掘效率。关联挖掘实验结果良好,得到了中医专家满意的关联规则。本文使用关联分析方法成功地完成了中医中风病证候诊断和治疗的相关性研究,也为中医学的知识发现提供了进一步研究的思路。
其他文献
近年来,房地产商开发的住宅小区规模日趋扩大,占地上千亩的项目比比皆是,但也随之出现了相应的问题。大型住宅小区的开发不是普通小区开发的规模化,它作为城市化进程中的一大要素
元代周伯琦的《六書正譌》共分為平聲上、平聲下、上聲、去聲、入聲五卷,是一部闡述《說文解字》,辨證字形的字書。在釋義方面,它以《說文解字》的釋義為主要參考,結合《玉篇
对于追求吉祥的中国人来说,如意纹样有着与众不同的特殊地位,它是中华文化在历史长河中不断积累与变化的智慧结晶,是艺术文化与现实生活相互碰撞、相互交融形成的吉祥符号,具
推测指说话人凭借客观依据或主观想象,通过推理,对未知的事情做出的一种不确定的结论,其结论在现实世界中或真或假,或真假难定。推测言语行为是一种常见的语言现象,一种使用
“文学性”是一个历久弥新的题目,是指文学文本与其他艺术文本相比所存在的特质差异。它与文学的本质相关,目前在我国文艺学界受到越来越多的关注。本文将注意力放在语言论和
本文首先介绍选题背景及研究意义,接着对国内外已有研究成果进行分类综述,,对美华生物技术股份有限公司市场营销这一问题进行研究。随后对益生菌系列产品营销的基础理论进行
家庭是个体成长的起点,也是影响个体发展的重要因素,本文通过对现代不同类型的家庭教育方式的分析,以及探讨最应提倡的家庭教育方式,来寻找最适应幼儿成长的家庭氛围和家长应
奈达“动态对等”理论强调读者反应,将译文效果的对等作为翻译的有效评判标准,从而有效地解决了直译与意译,归化与异化的翻译手段之争,为翻译实践提供了可行的指导方法,具有
档案工作者的胜任力能将档案工作岗位上表现优秀的员工与表现一般的员工区分开来,胜任力模型与档案工作岗位密切相关。随着IT技术与传统档案管理日益的结合,以及档案外事工作
本研究通过田野调查和实验语音学分析对湘语七地(新湘语:长沙、益阳、湘阴;老湘语:城步、新宁、双峰、湘乡)方言字首塞音的嗓音起始时间(VOT)声学特征进行系统地描写,并结合语料