高效用数据起源过滤机制及评估模型研究

来源 :陕西科技大学 | 被引量 : 1次 | 上传用户:yigeyongbao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的飞速发展为数据的产生、修改与共享带来极大便利,但同时数据质量变得难以保证。数据起源作为记录数据从产生到消亡的整个演变过程的一种元数据,可用于分析数据质量、数据处理过程反演、错误究责等。数据起源可能蕴含敏感信息,因此在不同组织间交换或共享数据起源时有必要保证起源安全。起源过滤是一种通过隐藏或删除敏感信息实现起源安全的新兴技术。针对现有起源过滤研究中的缺乏对过滤视图效用的定量评估、仅关注底层节点的过滤忽略依赖关系的过滤、过滤视图效用低下等问题,本文构建了过滤视图效用评估模型,并在此基础上提出了一种高效用数据起源过滤机制。本文的主要研究内容包括以下方面:第一,扩展了PROV起源模型,作为开展起源过滤机制评估与研究的理论基础。首先,形式化地定义了起源图等基本概念。其次,依据数据溯源的内涵定义溯源结果,并深入探究数据溯源与起源过滤之间的关系,介绍了基本的起源过滤操作,提出起源过滤约束。然后,定义不确定的依赖关系并证明引入不确定依赖关系对起源图进行修复的可行性。最后,将PROV起源模型中原有的依赖关系泛化为不确定的依赖关系,并基于此提出了修复操作,用于提高过滤视图效用。第二,阐明了过滤视图效用的本质内涵并对其进行形式化定义,构建了过滤视图效用评估模型,为衡量过滤视图的效用提供了评估标准。该评估模型通过量化原始起源图与起源过滤视图之间的差异评估过滤视图的效用,考虑了应用不同过滤操作所得起源元素的效用不同,对过滤视图中的节点、边以及连通路径按其效用进行细分作为评估指标,综合权重构建了过滤视图评估模型,设计并实现过滤视图效用评估算法,通过实验验证了该算法的性能与起源图大小负相关,与过滤视图和原始起源图之间的差异大小无关。第三,基于扩展的PROV起源模型,提出了高效用数据起源过滤机制。高效用数据起源过滤机制不仅实现了对底层节点的过滤,同时可实现对节点间依赖关系的过滤。该机制针对PROV数据起源模型中的三类节点和七类依赖关系分别制定了基于“删除+修复”的过滤规则,首先删除起源图中的敏感元素实现起源安全,然后根据敏感元素的类型以及敏感元素在起源图中的所在位置,引入扩展的PROV起源模型中的不确定依赖关系修复起源图。设计并实现高效用数据起源过滤算法,使用过滤视图效用评估模型验证了本文机制的有效性。实验结果证明本文过滤机制所得过滤视图相较ProvAbs机制所得过滤视图效用提高了15.26%,且性能高于ProvAbs机制。
其他文献
智能终端的普及与无线网络技术的进步推动了实时流媒体业务的蓬勃发展。如何通过多模终端的无线网络接口,利用多路径传输技术并发传输数据,为实时流媒体业务提供高质量的传输
目前,OCR技术对简单版面的分析已经解决并得到了一定的普及,然而随着信息时代的到来,文本图像的版面已经不再是简单的文字和图形的组合,而是涵盖了文本、表格、图形和图像等
随着社会经济的不断发展、科学技术水平的不断提升,互联网上的数字视频正不受限制地增长并且逐渐成长为一种新型的力量。这些视频大多数存储在非结构化的存储库中,因而对图像
纸介考试,作为课程评价过程的一个重要环节,是对课程和教学质量进行反映和评估的重要手段。现行的纸介考试多数根据外在的客观标准进行评价,在评价的过程中往往是外在的标准
人体行为识别是计算机视觉研究的一个重要课题,有着巨大的研究价值和广阔的应用前景。目前,它的应用主要集中在智能安防、病患监护、人机交互等领域。传统的人体行为识别研究
数字时代的到来和信息技术的发展,使得数字图像凭借它快捷、廉价的优点,在成像效果与成本间获得良好折中,逐渐取代了以往的胶片图像。为了满足不同需求,方便处理图像,各种图
随着物联网、云计算、大数据的发展和应用,全球数据量正在以前所未有的速度呈现出爆炸式的增长。为了满足数据业务飞速发展对海量存储数据的需求,存储系统应用多级闪存(MLC)
传统互联网模式中,企业所需求的计算和存储资源需要提前进行预估。不同企业业务规模大小不同,对资源需求量也存在较大差别。同时,企业都会储备一定额外的资源,用于高峰期可能
黄曲霉毒素B1(Aflatoxin B1,AFB1)是目前危害最大的霉菌毒素,经细胞色素P450(cytochrome P450,CYP450)酶代谢活化后生成强毒性代谢物AFB1-8,9-环氧化物(AFBO),后者能共价结合DNA、蛋白质等生物大分子,造成DNA损伤、基因突变、细胞代谢障碍等,甚至细胞死亡。肝脏是产生CYP450酶的最主要器官,因此成为AFB1的靶器官。AFB1不仅威胁人类健康和
计算机的诞生为人类开启了智能时代的大门,伴随着计算机技术的飞速发展,越来越多的技术成果被广泛应用于人类的日常生活与工作中,并将不断地服务于人类、造福于人类。在计算