论文部分内容阅读
中医学领域中存在着大量的病案资料,病案记录中的信息包含很多隐藏的、有价值的医学知识,而医学数据的网络化与数字化转变使得人工整理数据的方法不再可行。数据挖掘技术正是一种有效的借助人工智能方法获取医学知识的现代化手段,采用数据挖掘方法分析医学数据,不仅能够揭示隐含其间的病、证、症、治的规律和他们之间的有机联系,还能够得到有价值的医学知识,促进中医诊断的客观化,同时也是中医现代化的重大课题之一。本文主要研究数据挖掘方法在哮喘病案数据分析中的应用,主要包括提取哮喘主症状,获得中药配伍规律、用药与症状的关联关系,寻找症状-证型间的匹配规律,最终建立中医病案数据挖掘系统。主要工作如下:1)在数据预处理阶段,首先对临床数据进行初步规范量化,然后采用一种粗糙集属性约简算法-MIBARK算法提取哮喘主症状,期间通过实例展示了MIBARK算法的运行过程;设计了电子病案结构,建立病案数据库,为下一步中医病案数据挖掘做准备;2)在数据挖掘阶段,通过实例分析了Apriori算法的性能与不足,基于计算机对位串逻辑运算的快速反应,提出Apriori算法的改进算法(Apriori-BSO算法),相同条件下,测试对比了Apriori-BSO算法与经典Apriori算法的运行时效,采用Apriori-BSO算法对哮喘用药数据及症状-用药联合数据进行关联分析,挖掘出医药方剂配伍规律及症状与用药之间的关联关系,对比了Apriori-BSO算法与经典Apriori算法在挖掘哮喘医案数据时的运行时间;3)研究了BP算法的运行过程,分析了算法收敛速度慢与学习率需人为测试、调整方面的不足,提出一种基于竞争学习与学习率自适应的BP神经网络算法的改进(CAL-BP算法),采用改进算法对症状与证型之间的关系进行训练、预测,对比了BP算法与CAL-BP算法的训练、预测效果,并对比了MIBARK算法属性约简后与约简前CAL-BP算法的识别率;4)最后设计实现了集病案管理模块与数据挖掘模块于一体的中医病案数据挖掘系统。