论文部分内容阅读
随着大数据的发展,越来越多的行业开始深刻地认识到数据的价值,我国也已经将健康医疗大数据纳入国家大数据战略布局。医疗卫生信息平台、电子医疗设备与医疗仪器的迅速普及,导致了医疗数据的快速增长,且数据类型多样、关系错综复杂。随之而来的医疗数据安全问题开始受到广泛关注。医疗数据为我们的健康保驾护航的同时,保护数据中的隐私敏感信息也已经成为学者、从业者和普通大众所关注的热点。本文主要对医疗大数据隐私泄露行为进行定性和定量分析,根据定量分析结果来判定医疗大数据从采集、传输、存储、应用综合方面的隐私泄露程度。首先本文通过查阅资料及国内外相关研究后,建立针对于医疗大数据采集、存储、应用等模块的隐私泄露行为第一阶段指标体系共32条。经过专家的反复论证后,通过新增,删减、融合等方式最后总结出行为指标体系共17条。在得到专家一致认可后通过调查问卷的方式对指标体系中的行为因素进行权值打分,最终形成医疗大数据隐私泄露行为指标体系,为接下来的模型建立打下基础。在研究用户行为方面,本文在隐私Petri网研究的基础上,针对于医疗大数据隐私泄露行为自身的特点对隐私Petri网模型做了一些调整。并使用调整后的模型对指标进行分别建模,根据每个模块的流程图描绘出隐私Petri网的模型图,在分类进行状态描述的基础之上,对每个模型赋予不同的位置因素用以计算泄露可达性和泄露路径,最后根据全局模块规则,建立全局的隐私泄露路径集。仿真实验阶段,本文首先根据行为指标体系的打分情况分别计算出各模块每条泄露路径发生的可能性。在应用阶段的可能性计算当中,本文引入了大数据研究当中常用的无监督聚类算法对用户行为进行聚类分析,可以有效的分离出存在异常行为的用户。结合实验数据求出用户可信度,进而求出应用模块的行为泄露可能性权值,再根据调查结果的权重求出各模块的隐私泄露行为可能性及严重性。最后通过医疗大数据隐私泄露行为可能性与重要性总结了计算公式,计算出最后的隐私泄露度。通过仿真实验分析,本文发现在数据应用阶段最容易导致医疗大数据的隐私泄露,同时泄露之后的危害程度也是最严重的。综上所述,在隐私泄露行为研究的基础上,本文以隐私Petri网为基础,建立隐私泄露行为模型,最后对医疗大数据隐私泄露行为进行了量化分析。