基于动态上下文的XML隐私保护方法

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:danielddy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代下,数据的价值挖掘与隐私保护的矛盾日益增加。传统信息安全关注保护属性值的安全,而不包含语义;大数据时代的数据隐私保护要求在不暴露用户敏感信息的前提下进行有效的数据使用,关注的是能够实现数据价值的安全方案。
  关于非结构化数据安全研究的已有成果集中在属性加密、匿名发布、访问控制等传统模型方法上的改进,也有考虑加入上下文环境(静态)的访问控制规则处理和预防推理攻击的顶层数据结构设计,然而在数据模式与数据需求迅速发展的新形势下,现有的数据隐私保护模型也面临着新的挑战:(1)静态的访问控制模型没有考虑动态的上下文环境,在灵活变化的网络服务中应用效果欠缺,不适合变换的网络环境条件;(2)已有方案对数据的管理依赖于层次结构中的节点定位,实际运行中树结构冗余带来的路径定位和条件判断,硬件能耗代价高,随着数据复杂程度的加深和数据处理量的加大,甚至可能导致引擎的崩溃;(3)忽略了数据元素之间的语义关联,和层次结构本身的关联信息,无论哪种形式的访问控制方案都有可能造成数据信息的过度保护;(4)理论上很难验证顶层结构的推理完备,实践中又忽略了用户动态使用数据过程中不断查询结果的先验知识积累,没有考虑实际运行过程中的背景知识推理攻击。
  因此,结合大数据对象的语义本质和多源数据半结构化的组成特点,本文研究以语义关联为数据组织形式,基于动态上下文分层设计的半结构化数据 XML 的隐私保护方案,实现方便用户高效、最大限度的使用数据价值的同时,能够满足原始数据隐私保护的需求。
  具体研究内容包括:首先,基于用户本体实现数据内在的语义关联,结合形式化规范化理论描述基于本体的语义依赖,通过推理及相关研究给出语义依赖的理论体系;依据多源数据之间语义关联的本质,遵循自底向上的集成过程,避开传统冗余结构依赖的数据模型,给出倒排全局视图生成算法,实现基于语义的访问控制方案;强化用户的主体语义,结合访问控制规则中“主体否定优先”原则,有效的对原始数据可访范围进行限定,再应用查询策略处理较小规模数据,避免隐私属性访问同时,提高查询效率;最后,引入的动态背景知识上下文,定义先验知识域和隐私二分图,研究并实践抵抗背景知识攻击的隐私保护模型,创新定义 XML 文档语义编码,为实时有效抵抗推理攻击提供实现方案。
  具体来说,成果及创新之处有以下几点:
  第一,提出了基于语义依赖的数据组织新方法。大数据形成本身就是以语义为本位的,再由实体关联为主线结成‘网络’,数据的同名异义和异名同义是数据汇聚后常见的形态,将语义关联引入多源数据融合描述,不但可以解决不一致,还可以用最简单的结构描述最丰富的语义信息。
  第二,提出了动态上下文分层的设计框架。依据个体访问数据自然流程“登录”-“查询”-“连续查询”的不同阶段,将动态上下文划分不同层次定义,通过不同层次语义的动态管理,实现不同目标的隐私保护。
  第三,提出了语义关联获取授权的访问控制新模型。基于语义关联的访问控制方案可以追求数据价值最高的数据而不关心数据的组织方式,避开冗余结构,高效的获取用户可授权的数据。同时结合用户主体语义关联的访问控制规则“否定优先”,提高安全访问下的数据查询效率。
  第四,提出了实际运行中抵抗背景知识攻击的隐私保护新模型。将用户先验知识作为语义引入动态上下文,有效的依据用户先验知识积累导致语义环境变化,进行预防隐私泄露的方案,并在实际操作层面通过文档语义编码给出了存储和实时推理判定的可行性方案。
其他文献
互联网作为新一代信息技术(如:物联网、工业互联网、大数据等)的通信基础,其时延特征从时间维度表征了互联网的信息传播特性,是评价衡量互联网的最重要的性能指标。近年来,随着高性能集群计算、云计算、边缘计算/雾计算等新一代计算技术的飞速发展,面向互联网业务计算与部署的时效性问题已经逐渐转变为业务数据在互联网上传输的实时性问题,即通信时延问题。互联网发展至今,已经从原有的“抢空间”模式逐渐转移到“省时间”
学位
糖尿病视网膜病变(糖网)是糖尿病最为严重并发症之一,也是导致视力损伤或失明的主要病因之一。临床上,利用眼底图像进行定期的分类筛查和尽早的诊疗是控制病情发生、发展最有效的手段。当前糖网筛查主要依靠眼科医师人工地检查和分析眼底图像上的异常病变(如微动脉瘤、出血斑和硬性渗出),从而对其进行诊断与分类,这颇为费时费力,也制约了糖网筛查的大规模实施。此外,庞大的筛查人群和稀缺的眼科医师也成为了大规模糖网筛查
学位
随着服务计算、云计算的快速发展,网络上被部署了大量的服务资源,由于网络服务访问的便利性,越来越多的用户通过网络使用各种各样的服务资源以完成其业务应用。服务资源的快速增长,导致提供相近功能的服务数量日益增多,服务资源访问的频繁性使得服务请求数量在某一时间间隔可能会迅速增大,这使得服务选取问题不仅要考虑功能相近服务的质量,同时要考虑服务质量在大规模请求下的变化。而目前的服务选取问题大都没有考虑大规模请
学位
随着人们对高性能计算的不断追求以及芯片工艺的持续发展,实时系统的集成度越来越高,从而导致功耗密度不断增加;同时由高功耗引起的热问题也越来越严重,反过来严重制约了性能的进一步提升。高功耗降低系统的生命周期,高温度严重影响系统的可靠性和安全性。此外,功耗和温度之间存在一种恶性循环关系:功耗越大,温度越高;温度越高,则漏电功耗越大,进而功耗越大,反过来使得温度更高。进一步地,由于设备体量较小,实时系统的
学位
近年来,以深度学习为代表的人工智能技术在语义搜索、自动驾驶、智能问答、机器翻译等领域的应用取得了巨大进步,极大地促进了机器智能化水平的提升。事实上,机器智能实现的背后依赖的正是知识图谱技术。知识图谱作为大数据时代下知识组织的重要方式之一,以结构化的形式描述客观世界中的概念、实体及其之间的复杂关系,为互联网上海量、异构、动态的大数据的组织、管理、理解和利用,提供了一种有效的方式。自2012年Goog
学位
随着云计算及“软件作为服务理念”的扩散,互联网环境下软件系统的主要形态、运行方式、生产方式和使用方式正发生着巨大的变化。近来随着服务数量的爆炸性增长,网络上分布着大量功能相同、非功能特性各异的服务。如何在规模较大的功能相当的服务集合中选择质量较优且能够可靠运行的满足用户需求的服务成为一个亟待解决的问题。  在这种竞争环境中,服务的选取是一个复杂的决定过程,牵扯了许多利益相关者,服务提供商与候选服务
学位
阿尔茨海默症是继心血管病、脑血管病和肿瘤之后,威胁老年人健康的重要疾病之一,已经成为老龄化社会亟待解决的重要研究课题。随着世界范围的老龄化人口急剧增长,如何应对阿尔茨海默症已经成为全球共同面对的严峻的社会、经济学问题。目前,尽管对阿尔茨海默症神经生物学机理的研究已有显著进展,迄今尚无有效治愈或控制病情进展的方法。研究表明早期发现并干预可以延缓或阻止病情进展。影像标志物的检测分析是阿尔茨海默症早期诊
职业流动行为是指个人在职业生涯中的工作变动引起的人才流动现象,根据研究的层次,可分为微观(个人)、中观(用人单位内)和宏观(行业和地区间)三个行为粒度。职业流动行为受经济、文化和政治等环境因素的影响,与知识水平、职业追求和家庭背景等个人因素相关,且对个人、家庭、用人单位、社会经济甚至国家的人才战略等都有重要意义。随着经济全球化的发展,职业流动行为呈现出逐渐活跃的趋势,为相关分析和研究带来了新的机会
学位
机载计算机是飞机中最核心的部件,具有高可靠、高安全、高性能等特点。航空计算技术不断发展,对新一代机载计算机提出了更高的要求。美国率先研发了最新一代的机载计算机,提出了综合核心处理机(IntegratedCoreProcessor,简称ICP)的概念,并成功将其应用于F-35等重要机型。ICP的出现标志着机载计算机正从过去的分立式、混合式、联合式结构向高度智能化、综合化、模块化方向发展。ICP采用了
学位