论文部分内容阅读
医院信息系统的飞速发展产生了大量的医疗信息数据,使得海量的历史电子病历和诊疗数据变得纷繁复杂,如何从中获取有用的信息成为医疗信息研究的热点。而分类技术作为数据挖掘的一个分支已经在众多领域中得到广泛应用,传统的分类都假设实例与一个标记相关,而现实世界的实例通常与多个标记相关,如视频、文本、图像、患者的疾病诊断和治疗用药等,传统的分类算法显然不再适用,因此多标记学习成为一个重要的研究课题。本文介绍了多标记学习的理论和方法,并从医院信息系统多个数据库中提取了慢性乙型肝炎病例数据集。论文还利用提出的多标记算法对数据集进行了实验,并将该算法与其他算法的实验结果进行了比较分析,最终初步实现了慢性乙型肝炎联合药物推荐系统。本文首先对多标记分类的理论基础进行了阐述,总结了多标记分类的划分和策略,并给出了多标记分类的评价指标。其次,分别从医院电子病历数据库、医院信息系统数据库和检验系统数据库中提取出慢性乙型肝炎病例的基本信息、初次检验信息和临床用药信息,形成可供多标记算法实验的数据集,并对提取的数据集的特征信息进行降维,利用几种具有代表性的多标记算法对数据集进行标记映射。接着对提取的多标记数据集进行数据预处理,包括数据清理、数据集成和数据归约等。在此基础上,本文提出了LIFT-ML-KNN算法,利用该算法和其他几种多标记算法对慢性乙型肝炎数据集进行多标记学习训练,对几种关键的多标记算法评价指标结果进行了比较和分析,最后利用java语言在MyEclipse中实现了慢性乙型肝炎联合药物的预测,为该类病种临床路径的制定提供了强有力的支撑。