论文部分内容阅读
电子病历是医疗单位的医护人员对门诊及住院患者临床诊断和治疗过程的一个详细记录,其中包括数据、文字、图像、以及音频和影像等结构、非结构化信息。大多数的电子病历都是非结构化的文字数据,包括病人的出入院记录、病史记录等。随着国家医疗信息化程度的加深,记录患者健康状况及医生诊疗信息的纸质化病历正逐渐被医院信息管理系统HIS、医学影像信息系统PACS、临床信息系统CIS等关系型数据库所取代。然而这带来的仅是电子病历的存档介质由纸质向磁盘的形式变化,数据的共享形式依然只是处于归档状态,各个医疗机构的信息仍旧如同“信息孤岛”一样存在着。集成海量、异构、多源的电子病历信息是数据共享及提供个性化治疗方案的首要的一步。医疗信息涉及面广、数据量大、数据源各异、存储电子病历的医疗信息系统由于数据库厂商、版本等不同,其医疗数据模型也不同,这些都不同程度的增加了电子病历集成的难度。以往的做法是使用联邦数据库、中间件整合等方式集成关系数据库中的信息。但是在现实的应用中发现不同的集成方式存在以下弊端,如:数据一致性差、数据存储空间复杂度高、查询效率低,查询结果不精准,数据更新耗时。而语义技术在以上各方面均有较好的表现,它利用知识表示语言RDF(S)、OWL在信息集成、知识推理方面显示出极大的优势,这就为现实中解决电子病历的信息集成问题提供了可能。为了解决以上问题,本文提出了基于语义技术的电子病历信息集成框架,并利用此框架解决了冠心病电子病历集成及推理问题。本文主要贡献包括:(1)基于语义技术的电子病历信息集成框架的研究。通过对电子病历的内容和结构的研究,我们将电子病历信息分为两部分:1)隐性的、非结构化的专家诊断知识;2)显性的、结构化的医患基本信息和显性的、非结构化的诊疗过程记录信息。针对不同的信息源及信息结构,我们建立统一的信息集成模型,将非结构化、半结构化的信息转换用结构化的可以被计算机理解的语义信息。(2)海量、异构、多源的专家知识库的集成模型。电子病历中隐性的专家知识来自于专著、专家经验等,其中包括文字、图片、表格、视频等。为此我们根据Gruber本体构建原则并构建专家知识库模型。从医药健康网站、医学专著、医疗专家经验中提取冠心病诊断知识,构建和维护冠心病专家知识库。建立一个轻量级的本体(包括症状-疾病,疾病-治疗,治疗与药物等关系描述)。(3)显性电子病历信息集成模型。电子病历中的显性信息包括两种:1)存储在关系型数据库中的结构化的医患基本信息;2)非结构化文本类型的诊疗过程信息。针对前者我们利用D2RQ工具将关系型数据库信息转换为语义本体信息。对于显性的诊疗过程信息,我们通过建立电子病历诊疗过程本体库模型来集成这部分信息。为了完成以上本体之间的知识共享,我们采用国际疾病分类统一编码ICD来集成同一种病情的病历。在以上工作的基础上,我们添加了Prolog诊断规则并建立冠心病电子病历集成系统进行知识的验证和应用。综上,本文通过对电子病历的研究将信息分为隐性的专家诊断知识和显性的病患基本信息和诊疗过程记录两部分。在对电子病历内容和结构分析的基础上,我们提出了基于语义技术的电子病历信息的集成框架。利用此框架我们建立了冠心病专家知识模型和诊疗过程本体库,并利用D2RQ工具将关系数据库中的病患疾病信息转换为语义本体库,通过冠心病ICD编码将集成同类型的电子病历。希望本文的研究工作能够为我国医药信息化的建设贡献一份力量,为今后解决类似的问题提供有益的参考价值。