论文部分内容阅读
近年来,随着大数据技术的不断发展,医疗卫生领域数据的价值也逐渐突显。因此,实现医疗数据的信息共享变得尤为重要。然而,由于我国医疗信息化建设前期缺乏统一的技术和标准规范要求,导致目前各类医疗信息系统间数据难以共享的“数据孤岛”现象。这种现象严重阻碍了大数据技术在医疗健康领域的应用,阻碍了我国医疗健康业的发展。通过对区域健康医疗数据的异构特性进行研究,不难发现导致区域异构医疗数据集成困难的主要原因有以下几点:1.不同医疗机构建设的医疗信息系统采用的数据结构不统一。2.不同医疗信息系统建设过程中采用的数据标准各有不同。3.传统的接口开发数据共享方式效率低,缺少统一高效的区域健康医疗数据集成共享平台。本文针对上述问题分别从数据标准、数据集成方法以及数据集成效率三个方面逐层展开。首先依据国家卫生部门发布的医疗数据标准结合其它各省市建设经验,根据本地区实际情况制定了电子病历和健康档案数据标准。然后引入元数据概念,通过映射匹配的方法建立起源数据结构与目标数据结构间的映射关系。通过值域映射的方法建立源数据标准与统一数据标准间的字典映射关系。从而构建起一套基于元数据的异构医疗数据集成模式,很好的解决了异构医疗数据间数据结构和语义异构问题。最后在开源ETL项目Kettle基础上进行二次开发,引入贪心调度算法优化原始任务调度策略,实现了区域健康医疗数据集成系统,提高了数据集成效率。此外,本文基于集成的电子病历数据采用统计分析和关联规则分析方法进行数据分析,并通过可视化技术展示分析结果。目前,本文设计实现的区域健康医疗数据集成系统已作为淮南市人口健康信息平台的子系统投入实际运行。