论文部分内容阅读
关联规则是数据挖掘技术中一项重要的技术分支,该技术通过分析数据集中各项集之间的关联性,最终得到数据之间重要的关联关系。一般关联规则得到的规则表达形式都比较简洁,易于阐述和理解,从大型数据库中挖掘关联规则的研究已经成为近年来数据挖掘研究领域中的一个热点。医院信息系统(Hospital Information System, HIS)为医院管理和医疗活动提供了便捷的信息管理方式和联机操作服务,其使用过程中产生的大量医学信息数据是对医疗活动的真实记录。如果能从积累的医学诊断数据中挖掘出一些潜在的疾病间的关联信息,并经过信息的辨别与论证,就可以提取出有价值的疾病诊断和预防知识,从而为疾病的诊断和治疗提供科学的决策。然而目前大多数医院使用的HIS系统所采用的数据处理与分析技术,不能充分挖掘出海量数据中隐藏的知识。因此如何将关联规则等数据挖掘技术引入HIS系统,充分挖掘医院诊疗数据的价值,提高疾病诊断的准确性以及增强疾病预防的可行性,成为亟待解决的实际问题。本文在研究各类数据挖掘技术的基础上,结合青岛海慈医院HIS所提供的中医呼吸内科诊疗数据,重点探讨了关联规则算法在呼吸内科诊疗数据中的应用,主要研究内容包括:(1)调研并分析了当前国内外数据挖掘技术在医学领域的研究现状。(2)深入研究了Apriori关联分析算法的处理机制,考虑到医院诊疗数据更新快,门诊医生又时常需要快速分析特定疾病间的关联性的现实问题,本文提出了一种改进的Apriori算法。(3)详细阐述了改进的Apriori算法在海慈医院呼吸内科诊疗数据中的应用过程。目前本文所设计并开发的疾病关联分析系统,已在医院门诊测试运行,挖掘出的疾病关联规则为医生临床诊病提供了可靠的数据支持。