论文部分内容阅读
随着关键信息技术的不断突破,可穿戴设备在形态和功能上都快速发展并迅速在人们的生活中得以普及。受限于可穿戴设备的计算、存储能力,大量数据将被存储在云端。基于商业合作、科学研究等需求,可穿戴设备数据拥有者需要将这些个人数据发布给第三方机构或者公布至互联网之中。如何既保护数据中的个人隐私不泄露,又保证数据具有一定程度的可用性,是当今热点研究问题之一。本论文对隐私保护技术进行了论述,并着重对发布隐私保护模型以及相关的基础概念做出了归纳。本文将可穿戴设备数据发布模型分为静态、动态处理两部分。在静态阶段,针对MAA-SEA(Micro Aggregation Algorithm Sensitive Attribute Entropy)算法的不足,提出了FMAA-SEA模型,并以此为基础提出了支持动态数据的DSR-DAGU算法模型。最后针对应用场景中可能出现的特殊数据情况,本文提出了DSR-DAG 算法模型在偏态数据下的应用。论文的主要工作如下:(1)在静态数据处理过程中,针对MAA-SEA算法灵活性不足的问题,提出了FMAA-SEA隐私保护算法模型,通过数据可用性和隐私保护力度两种参数的引入灵活地计算聚类代价FPV值。并引入属性权重的概念,根据具体的使用场景个性化的调整隐私保护的侧重点。(2)在动态数据处理过程中,以上述静态算法为基础,针对可穿戴数据上传频率高、数量少的特点,文本提出了面向数据流的动态分组属性更新隐私保护模型DSR-DAGU。通过设计的缓存表机制,抑制了更新数据造成的信息损失,确保数据更新后的可用性;并通过敏感属性动态更新机制,在最小信息损失的情况下保证了隐私信息不泄露;最后引入拉普拉斯噪声机制,并通过将发布结果中准标识符属性与敏感属性分离的做法进一步提高隐私保护力度。(3)以(n,t)-closeness算法思想为基础,结合概率分布距离的相关定义,本文提出了在偏态数据类型下DSR-DAGU隐私保护模型的应用。本文论述了发布隐私过程中可能存在的两种偏态数据形式,并通过微聚集过程中的实时偏态检测,灵活调整FPV值的计算方式,根据具体的数据情况合理的调整相应的聚类策略。论文分别在对应的章节末尾对提出的算法进行了仿真验证,从计算复杂度、信息损失、伪数据个数和隐私保护效用等方面论述了 DSR-DAGCU算法模型的有效性和可行性。最后论文对研究成果进行了总结,并针对存在的问题对下一步研究方向进行了展望。本文共使用图9幅,表18个,参考文献63篇。