基于语义的电子病历数据集成

来源 :西南大学 | 被引量 : 0次 | 上传用户:lk656lk55lk6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历是医疗单位的医护人员对门诊及住院患者临床诊断和治疗过程的一个详细记录,其中包括数据、文字、图像、以及音频和影像等结构、非结构化信息。大多数的电子病历都是非结构化的文字数据,包括病人的出入院记录、病史记录等。随着国家医疗信息化程度的加深,记录患者健康状况及医生诊疗信息的纸质化病历正逐渐被医院信息管理系统HIS、医学影像信息系统PACS、临床信息系统CIS等关系型数据库所取代。然而这带来的仅是电子病历的存档介质由纸质向磁盘的形式变化,数据的共享形式依然只是处于归档状态,各个医疗机构的信息仍旧如同“信息孤岛”一样存在着。集成海量、异构、多源的电子病历信息是数据共享及提供个性化治疗方案的首要的一步。医疗信息涉及面广、数据量大、数据源各异、存储电子病历的医疗信息系统由于数据库厂商、版本等不同,其医疗数据模型也不同,这些都不同程度的增加了电子病历集成的难度。以往的做法是使用联邦数据库、中间件整合等方式集成关系数据库中的信息。但是在现实的应用中发现不同的集成方式存在以下弊端,如:数据一致性差、数据存储空间复杂度高、查询效率低,查询结果不精准,数据更新耗时。而语义技术在以上各方面均有较好的表现,它利用知识表示语言RDF(S)、OWL在信息集成、知识推理方面显示出极大的优势,这就为现实中解决电子病历的信息集成问题提供了可能。为了解决以上问题,本文提出了基于语义技术的电子病历信息集成框架,并利用此框架解决了冠心病电子病历集成及推理问题。本文主要贡献包括:(1)基于语义技术的电子病历信息集成框架的研究。通过对电子病历的内容和结构的研究,我们将电子病历信息分为两部分:1)隐性的、非结构化的专家诊断知识;2)显性的、结构化的医患基本信息和显性的、非结构化的诊疗过程记录信息。针对不同的信息源及信息结构,我们建立统一的信息集成模型,将非结构化、半结构化的信息转换用结构化的可以被计算机理解的语义信息。(2)海量、异构、多源的专家知识库的集成模型。电子病历中隐性的专家知识来自于专著、专家经验等,其中包括文字、图片、表格、视频等。为此我们根据Gruber本体构建原则并构建专家知识库模型。从医药健康网站、医学专著、医疗专家经验中提取冠心病诊断知识,构建和维护冠心病专家知识库。建立一个轻量级的本体(包括症状-疾病,疾病-治疗,治疗与药物等关系描述)。(3)显性电子病历信息集成模型。电子病历中的显性信息包括两种:1)存储在关系型数据库中的结构化的医患基本信息;2)非结构化文本类型的诊疗过程信息。针对前者我们利用D2RQ工具将关系型数据库信息转换为语义本体信息。对于显性的诊疗过程信息,我们通过建立电子病历诊疗过程本体库模型来集成这部分信息。为了完成以上本体之间的知识共享,我们采用国际疾病分类统一编码ICD来集成同一种病情的病历。在以上工作的基础上,我们添加了Prolog诊断规则并建立冠心病电子病历集成系统进行知识的验证和应用。综上,本文通过对电子病历的研究将信息分为隐性的专家诊断知识和显性的病患基本信息和诊疗过程记录两部分。在对电子病历内容和结构分析的基础上,我们提出了基于语义技术的电子病历信息的集成框架。利用此框架我们建立了冠心病专家知识模型和诊疗过程本体库,并利用D2RQ工具将关系数据库中的病患疾病信息转换为语义本体库,通过冠心病ICD编码将集成同类型的电子病历。希望本文的研究工作能够为我国医药信息化的建设贡献一份力量,为今后解决类似的问题提供有益的参考价值。
其他文献
随着信息技术的不断发展,人们所要面对的信息量与日俱增,如何快速处理如此庞大的信息量已成为人们所要考虑的重要问题之一。图像信息在整体信息中所占的比重也在日趋增加,实现图
矿井环境监控系统是无线传感器网络典型应用的一种。井下无线传感器网络要求路由协议能够均衡网络节点能耗、提高网络通信的可靠性、适应网络结构的变化以及延长网络生存期等
近年来,复杂网络逐渐成为描述与分析现实复杂系统的重要工具而备受关注。复杂网络的大规模性、强耦合性、局部性等特点促使研究人员通过局部特性来刻画与研究整体特性。其中,社
本文旨在提高有限域上椭圆曲线算术运算的效率,主要研究了二进制扩域上的平方运算、有限域上的求逆运算以及椭圆曲线上的标量乘运算,并针对三种不同的运算分别提出了一种快速
随着计算机科学及彩色输入/输出技术的发展,人们对于色彩再现的质量提出了更高的要求。研究发现,当图像在跨设备复制时经常出现颜色不匹配的现象,在色彩管理系统中加入色外观
近年来,智能卡在很多领域被广泛应用,Java卡作为一种高端智能卡,具有一卡多应用和高安全性等优势,并且其上的应用程序理论上在所有的Java卡上都可运行,便于不同厂商的产品在同一个
社会网络是在人类学,心理学,社会学,图论等理论的基础上发展起来的一门科学,至今已经有70多年的历史了。计算机网络经过了半个世纪的发展,现在已经有了长足的进展,各种网络应用层出
序列比对是生物信息学中一种基本的信息处理问题,对于发现核酸和蛋白质序列上的功能、结构以及进化信息具有非常重要的意义。随着生物序列数据库中序列数据的激增,设计出能够处
复合模式查找是生物信息学中模式发现问题的一个新的研究领域,而寻求效率更高,精度更高的复合模式查找算法将是此研究领域的热点与目标。复合模式查找问题是模式查找问题的泛化
随着通信网络的广泛应用,通信网络测试技术已成为当前研究的热点。目前,大多数通信网络测试系统只能针对某类指标进行专项测试,随着通信网络的日益复杂,迫切需要一种针对多类指标