论文部分内容阅读
近年来,随着社交网络的流行以及地理位置采集技术在移动设备上广泛使用,通过收集用户的移动轨迹数据(即空间数据集)实现对用户行为习惯的分析已成为热门研究。空间数据集遭到泄露可能引发个人行为习惯、健康状况等隐私信息的暴露,因而用户发布位置信息过程中如何保护个人隐私不被暴露是一个具有挑战性的课题。差分隐私描述了一个极为严格的攻击模型,同时对隐私暴露风险提供了严谨、定量化的表示和证明,因此被广泛运用于数据发布的隐私保护。但是,其应用于基于网格层次划分的位置数据发布中,存在一定改进的地方,如:当前的研究往往忽略了每个格子中的位置数据分布不均匀,因而不能充分考虑数据的分布情况以及数据的隐私保护需求;在加入噪声阶段,对每层所有格子的计数查询结果加入统一规模的噪声,没有根据每个格子中数据的隐私保护需求加入相应噪声值,容易产生相对误差,进而降低数据查询精度。 因此,本文提出了一种基于空间数据集隐私保护需求的噪声动态分配算法模型。该算法模型通过测算数据的离散程度定量描述数据的分布情况,进而定量描述其隐私保护需求;最后根据每个格子中数据的隐私保护需求,对数据集态动加入相应规模的噪声,实现减少相对误差,提高数据的查询精度。 本文为充分地考虑到每个格子中数据的分布情况,通过计算数据每个格子中数据的标准差圆半径,以此表示每个格子中数据的离散程度,进而定量地描述每个格子中的数据的分布情况。 其次,在为每层格子中数据加入噪声阶段,根据每个格子中数据的标准差圆半径在当层所有的格子的标准差圆半径所占比例定量的表示数据的隐私保护需求,进而根据数据集不同的隐私保护需求动态地加入相应的隐私预算,实现不同分布情况的数据动态加入不同的噪声值。实现减少相对误差,提高数据的查询精度。 最终,本文基于以上理论,设计并实现了基于空间数据集隐私保护需求的噪声动态分配算法模型(SDC-DP)。通过仿真实验对算法模型的性能进行了验证研究。实验结果表明该算法模型能够有效描述数据的分布情况以及隐私需求,同时很好的减少相对误差。