论文部分内容阅读
作为新兴的数据处理技术,数据挖掘是伴随着数据库技术的发展而逐步完善起来的,主要是为了从大型数据库中高效地发现隐含在其中的知识或规律,并为人类专家的决策提供支持。数据挖掘已经在许多领域得到应用,在医学领域的应用虽然刚刚起步,但也表现出良好的发展势头。 五千年的中华民族的文化底蕴,是中医药发生、发展的基础。近几年来,中医药科学问题的现代化研究不仅是中医药本身的研究重点,也成为其他学科,如化学、药物学研究的重点。几千年的经验积淀,中医药已经积累了海量数据。如中药方剂数据中蕴涵了大量有益信息,这些信息却很少得到充分的挖掘和利用,靠手工操作来理解分析这些数据己远远超出了人的能力。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则。迅速发展的数据挖掘技术,为此提供了有效途径。 随着社会经济的进步与发展,威胁人类健康的疾病谱正在变化。慢性非传染性疾病对国民、尤其是老年人群的健康的威胁越来越大,最为明显的是2型糖尿病在全球范围内的几近流行的上升趋势。积极开展糖尿病及其并发症的防治已成为目前医学界研究的热点。 本文就是以治疗糖尿病的中药方剂数据为研究样本,采用数据挖掘技术对其用药规律进行了有益探索。首先总结了数据挖掘的研究现状及最新进展,并简单介绍了中医药治疗糖尿病的相关知识。然后探讨了数据挖掘的基本理论和方法,并选择合适的算法应用于中药方剂数据库,挖掘其中有用的知识。 本文提出了数据挖掘方法应与领域相结合的思想。主要做了以下工作:对中医药方中不规范的数据进行了处理,建立了基本库和应用库;对关联规则及算法进行了改进,以发现中药配伍的规律;并引进了聚类算法分析技术,通过聚类分析方法对药物进行聚类,以适应针对大型数据库中混合数值和分类数据。因为在数据挖掘领域中,研究工作已经集中在为大型数掘库的有效和实际的聚类分析寻