论文部分内容阅读
大数据时代的来临,使得各种各样的网络服务充斥着人们的生活。人们享受着互联网技术带来的便利和对生活方式的改变的同时,数据安全的阴云也悄然笼罩。为了提供足够便利的服务,服务提供商在服务提供前和服务过程中往往需要收集大量的包含个人隐私敏感信息的用户数据,这样的场景非常常见。在这个过程中,对于收集的大量数据进行处理和使用带来了一系列的安全和隐私问题,引发了人们对个人隐私信息的普遍担忧。隐私不同于其他概念或范畴,它与主体的主观想法密切相关,无法统一地界定隐私的包含范围和重要程度。因而解决隐私问题应该要考虑主体的个性化需求。传统的面向隐私的访问控制系统在为数据提供者提供个性化隐私保护方案上考虑较少,因而无法精确度量和控制被保护数据的隐私信息。此外,随着互联网用户对隐私的担忧不断加深,单一的隐私方案很难满足实际需求,推动隐私方案走向多样化的发展趋势。访问控制是保障数据安全的重要技术之一,使用访问控制来约束数据访问者的行为已经成为在线数据管理中通用的技术。一般访问控制模型完成的主要工作是解决数据访问的授权问题,阻止非法用户的访问以及合法用户的非法访问行为,保障数据在安全、可控的环境中被授权访问。随着访问控制数据管理场景的丰富和数据计算环境的发展,管理授权访问时需要考虑越来越多的问题,对个人隐私的保护就是其中之一。面向隐私的访问控制方案,针对安全授权的过程中的隐私问题。基于对访问客体个性化隐私建模、提取隐私策略并应用于访问控制过程,要求授权机制对数据主体的个人隐私可控。一方面通过个性化的模型构建,可以提高访问控制系统对数据的感知能力,增强服务的友好性和灵活性。另一方面,动态的隐私策略能够适应访问主体对数据的授权操作,有效解决恶意访问进行推理攻击的问题,避免数据主体的隐私损失并识别恶意行为。增强访问控制服务系统的隐私安全性。本论文的主要研究内容与成果如下:(1)提出基于本体推理的个性化隐私定量计算算法。从数据主体定义的抽象隐私概念出发,对知识图谱中的结构化概念结点进行遍历计算和权重分配,由此得到全本体抽象概念集合中的每个结点对隐私概念的泄露值,这个计算结果与本体中概念到隐私结点的路径有关。本文从有限个隐私信息结点出发,将少量隐私敏感需求扩展成包含大量知识的定量计算隐私描述,形成科学性的抽象概念隐私泄露计算模型。(2)提出面向访问客体的个性化隐私模型。访问客体,即访问控制中被访问的数据集合,访问客体数据的提供者称为隐私主体。结合本体隐私算法提供的抽象概念隐私泄露计算模型的计算结果,加上对实际访问数据的内容进行分析抽取和概念映射,实现抽象概念实体化。将这个流程加以整理,形成符合个性化需求、面向数据内容隐私的通用定量模型。为后续访问控制阶段利用隐私模型动态生成访问策略、做出符合隐私安全的授权决策提供详细的隐私数据,为整个访问控制机制的形成奠定基础。(3)提出历史行为驱动的动态访问控制模型,根据访问主体的历史授权纪录,以及申请授权的数据隐私情况,动态生成访问策略并做出授权决策的访问控制模型。该模型从访问客体的隐私角度监督访问主体用户的行为,以历史授权行为纪录(审阅纪录)为驱动,对访问客体的隐私内容进行授权管理。(4)综合整理以上研究内容,提出基于语义推理的面向个性化隐私的访问控制,并实现原型系统的构建。通过评估实验,验证机制的有效性和可行性;通过对比实验,验证模型的优越性。实验结果表明,基于语义推理的面向隐私保护的访问控制机制(Semantic Inference Based Access Control for Privacy Protection,SIBAC)能够有效地识别文本数据的隐私内容并构建个性化隐私模型,用于对访问控制的个性化隐私授权管理。有效解决访问控制过程中对个人隐私泄露的担忧,在保证资源分享有效性的前提下,实现访问控制过程中对隐私安全的要求,提高隐私保护的个性化程度。