论文部分内容阅读
癌症、心脏病、糖尿病等重大突发疾病的早期发现和确诊是疾病成功治疗的关键。目前,对这些疾病的诊断主要依靠医生的临床经验。而我国的医疗资源相对不足,不同地区、医疗机构间的诊断水平差异较大,因此导致患者无法得到及时的治疗,医疗质量难以得到有效保证。本文将人工智能中较为成熟的技术——案例推理和贝叶斯网络引入医疗诊断中,通过分析过往临床数据,将医生诊断经验形式化、客观化,以提高诊断的准确率。贝叶斯网络和案例推理具有其各自的优缺点,能将二者进行有效融合并应用于医疗诊断的模型还非常少。本文在分析了贝叶斯网络和案例推理的多种混合模型架构后,结合医疗诊断的特点,提出了一种BCBR模型。该模型以案例推理作为基本推理架构,将贝叶斯网络作为一种数据挖掘工具来获取诊断属性间的关联知识,并利用其特点简化案例检索过程。首先,通过计算信息增益比率,从大量诊断属性中筛选最优属性子集,并对各属性分配权重。其次,将数据分为各个子集,对每个子集分别建立贝叶斯网络。对子集中的数据进行聚类,缩减检索空间,然后以框架的方法进行案例表示,从而得到了初始的案例库。再次,将案例检索分为初始匹配和二次检索两个过程,首先筛选出较匹配的一系列案例,再利用距离的方法计算相似度,从而得到最匹配的案例。最后,使用最匹配案例的贝叶斯网络对待诊断病例进行判断。本文将BCBR模型应用于乳腺癌诊断问题,使用美国UCI数据库中的Wisconsin乳腺癌数据集进行模型的训练和测试,并将结果与朴素贝叶斯分类器、案例推理分类器等进行了性能对比。结果表明BCBR模型对乳腺癌的诊断整体准确率、灵敏度和特异性均有较好的表现,证明了其应用于医疗诊断时的有效性。