论文部分内容阅读
随着计算机科学与技术的飞速发展和广泛应用,包括医学在内的各学科领域产生的数据量都在急剧增加。为了在这些存储起来的海量数据中发现有价值的知识及规律,人们结合统计学、数据库、人工智能、神经网络等技术,利用数据挖掘的方法来解决这一问题,而关联规则挖掘的应用是数据挖掘领域中一个重要的研究课题。目前,利用关联规则挖掘发现知识已成为各学科广泛关注的热点。随着关联规则挖掘技术的日渐成熟,如何将这一方法运用于从大量的医学数据中找出其内在关联规则的研究,为临床疾病监测、药物治疗效果的评价及疾病预防提供有效依据,更是一个新的研究内容。本课题利用关联规则挖掘的经典Apriori算法对具有隐私性、多态性、不完整性、时间性和冗余性等特点的医学数据进行数据挖掘分析。首先使用Apriori算法寻找数据库中数据的频繁项集,然后根据频繁项集生成强关联规则,以发现海量数据中项集之间有用的关联关系或模式。最终的目的是对关联规则挖掘在临床疾病监测、药物治疗效果的评价以及疾病的预防等方面的应用进行分析研究。如:通过关联规则挖掘对2型糖尿病并发症数据和肝病病人药物治疗效果的数据进行分析,得到的结果可为2型糖尿病并发症的早期预防提供参考,也可为肝硬化治疗的规范性用药提供决策依据。本论文在详尽分析数据挖掘和关联规则挖掘特点的基础上,阐述和分析了关联规则挖掘的Apriori算法、基于划分的算法和FP-tree频集算法等经典算法;分析了医学数据的特点,研究了关联规则在相关疾病数据中的应用,并且使用Apriori算法对所收集的病例数据中2型糖尿病三种主要并发症(高脂血症、高血压、冠心病)之间的关系和肝硬化病人用药数据中药物治疗效果进行了数据挖掘及分析研究,研究结果可为2型糖尿病三种主要并发症的早期预测提供参考。在临床实践中,可以对2型糖尿病患者有针对性的采取对上述三种并发症的检查和治疗措施,尽早地发现由2型糖尿病引发的其它病症,减少治疗成本和病情恶化的可能。对肝硬化病例的关联规则挖掘研究结果可以为其规范性用药提供决策依据,在临床实践中可以建立肝病治疗用药字典,从治疗效果和维护患者利益的角度出发,合理选择用药,制定肝病治疗最佳用药方案,改善治疗效果,提高治疗效率,也可作为药品审计依据。研究结果表明,在医疗卫生领域的疾病预防和药物治疗等方面的数据中进行数据挖掘处理和分析是一个值得重视的研究方向。