论文部分内容阅读
现代电子医疗记录系统利用大量的文本图表来展示孕妇的身体检测数据,医生往往需要阅读大量文本,无法快速找到所需信息且不能做到及时确诊孕妇身体状况。同时,孕妇产检时的各项指标虽指明其身体状况良好,但仅凭单项指标并不能判断孕妇本身潜在的疾病,例如未妊娠或妊娠期间因其他原因引起的潜在妊娠合并症,如何结合多项产检指标对孕妇健康情况进行描述是一个重要的研究课题。本文使用医院孕检妊娠妇女的电子医疗产检记录数据,即孕检孕妇的基本信息及妇科常规检查项记录数据。在对孕检数据预处理之后,论文采用多种聚类算法对产检数据进行簇间分离,旨在帮助医生发现各个集群中孕妇关键产检指标对妊娠合并症的作用;同时提出病例样本相似度算法,用于寻求同簇中就诊孕妇的相似病例,分析其潜在可能患有的妊娠合并症。最后提出基于聚类的医学可视化设计系统。本文的主要贡献体现在以下三个方面:1.为获取到具有实际医学意义的集群,探寻各集群中的关键产检指标,挖掘能识别妊娠合并症但以往被忽略的产检指标,本文通过优化基于距离度量的明可夫斯基算法,提出基于多维产检指标的相似度度量算法,生成更合理的孕妇集群。通过可视分析效果图对比和质量评估指标值证明其能较为有效地划分孕妇集群,相比于传统基于距离度量的相似度度量算法,多维产检指标相似度度量算法更具有参照性和实用性。2.为识别孕妇关键产检指标的相关性,查找就诊孕妇相似病例样本,更好地分析就诊孕妇在妊娠期间会患有病例样本中类似的潜在妊娠合并症。本文采用病例样本相似度度量算法近一步寻找近似病例,缩小比照范围。通过实验数据抽查取样对比,即是说将该算法最相似病例样本的妊娠合并症类型与个体的实际妊娠合并症类型比较是否一致从而获得比例值大小,最终比例值大小分值较高,由此得出该算法可以为就诊孕妇的医疗诊断提供更详细的病例参考。3.基于大规模的电子医疗产检数据,多维产检指标的相似度度量算法和基于聚类分析为基础的可视化系统,本文设计并实现了潜在妊娠合并症患者识别的可视分析系统。该系统集成众多医疗信息数据可视化技术和可视分析功能,用于分析就诊孕妇其可能患有的潜在妊娠合并症。最终,通过三种实验案例证明可视化系统的有效性和实用性。