论文部分内容阅读
信息时代,大量的数据从网络、智能设备中不断产生并且传播,当全世界意识到数据所携带的价值,政府层面通过出台相关鼓励性质的政策文件,推动产业的进步。搭建了促进数据发展的大数据平台,鼓励风口的新型产业和传统实业相结合,迸发出更加强劲的经济活力,为的也是充分发挥大数据的价值。随着医疗数据规模日渐增长,医疗数据日益复杂,大数据技术在医疗方面的应用价值也凸显出来。我国的医疗在近年来已有了很大的改善,度过了最初的医疗体系不完善,某些乡镇医疗水平还很落后的阶段。但是我国人口众多,现在面临着最突出的问题是全国相对优质的医疗资源由少数省会三甲医院掌握。导致患者蜂拥各大医院的现象严重。有些患者在社区医院能解决的问题依然愿意去三甲医院,医院的服务能力有限,只能对患者进行劝阻,但是并不能改变现状。医院和医务人员不得不超负荷来满足患者的需要。在做这种情况下,减少医务人员负担,节省医疗信息资源传递的成本就显得尤为重要。于是大部分医院都引进使用医疗信息管理系统(Hospital Information System,HIS)。无纸化的医疗系统为医护人员和患者都提供了便利,与此同时各个医院通过智能医疗系统累积的大量医疗数据蕴含着巨大的未开发价值。但是由于数据的易得性,患者的个人医疗信息在使用HIS时的隐私泄露风险也随之提高,故医疗信息系统的数据应用和医疗数据的访问权限控制研究很有必要。为了充分利用HIS中电子病历(Electronic Medical Record,EMR)的数据价值,同时降低诊疗过程中医疗数据被访问时患者隐私泄露的危险,本文提出一种基于授信额度计算的HIS访问控制模型。将HIS中医生诊疗过程给出的EMR进行收集聚类,形成可供参考的EMR数据库,在此基础上增加对病历的质量控制,如完整性、时效性、格式一致性、逻辑性进行比较校验。通过数据库智能计算病历相似度给出智能诊断及相似病历推荐治疗方案,根据优化算法当病历在该科室范围内各项指标处于上游时,会被标记为优质病案,辅助医生做出诊断,减少误诊率。同时根据成熟的HIS数据库,将医生的诊断目标和实际的病历数据访问记录使用医学术语——ICD编码匹配功能进行智能回填,将规范的ICD编码进行数学公式形式化,使用交叉熵和杰卡德距离的数学方法来计算相关度,得出诊断与资源访问的合理性校验结果。历史记录的相关度结合时间窗提出了HIS中授信额度的概念,通过授信额度的计算将信任值量化。最终根据访问控制策略授权匹配授信额度和授信区间来达到动态限制医生访问权限的目的。整个模型建立了一个“医生——电子病历——历史记录——信任评估”的智能访问控制流程。最后使用合作医院提供的真实数据的完成EMR聚类实验,证明本文提出的方法可以有效将同一科室中EMR按照相似度准确聚类,以达到后续的智能诊断推荐。模型在实验中能够自动计算医生的授信额度,并用低数值惩罚过度访问行为,且根据历史记录自动更新授信额度,同时通过仿真对比试验证明了添加授信额度和EMR应用的HIS,在使用过程中能够有效抑制医生有意或者无意的过度访问行为的发生,以起到对医生诊疗过程隐私泄露的有效控制。