轨迹序列数据发布差分隐私保护研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:violence211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着带有定位功能设备的广泛普及,定位服务提供商等数据管理者已收集了大量用户位置数据及移动轨迹数据。数据中可能包含用户的隐私信息,直接发布此类数据集与第三方共享,可能会导致个人隐私泄露。差分隐私可以防止背景攻击,有效保护数据隐私。如何将差分隐私应用于轨迹序列数据集中,生成发布具有高数据可用性的数据集,是当前研究的主要方向,也是本文关注的重点。本文针对连续型轨迹序列数据,研究数据发布差分隐私保护方法,定义问题并提出基于概率分布与聚类的解决方案,具体研究内容如下:(1)定义了差分隐私轨迹数据发布问题:对轨迹序列数据进行介绍,此类数据具有序列性、高维性、稀疏性等特点,总结当前主流攻击模型,分析当前隐私保护方法的不足,设计非交互式数据发布差分隐私保护模型,提升发布轨迹数据集的隐私保护水平,保留更多数据信息。同时,设计采用了6种评价指标,分别从统计、频繁模式、欧式几何等方面评价模型发布的数据集。(2)提出一种新的基于概率分布的轨迹序列数据发布差分隐私保护模型。第一步需要去除冗余轨迹点,对连续型的轨迹进行精简,基于最小描述长度提取具有代表性的轨迹点。然后根据网格内的轨迹点占比和自适应地迭代生成满足差分隐私保护的多级网格结构,并将轨迹点映射其中。之后提取建立满足差分隐私保护的轨迹起止点概率分布模型、转移概率模型以及采用指数机制选择建立轨迹长度模型,来保存轨迹相关信息,再以此生成新的轨迹数据集。最后通过基于方向与轨迹点密度的后处理方法,发布综合轨迹序列数据集。在真实数据集与模拟数据集上,使用5种评估方法从统计学、频繁模式方面验证本文提出的模型发布的数据集具有更高的数据可用性。(3)提出一种新的基于聚类的轨迹序列数据发布差分隐私保护模型。第一步对每个时间戳内的轨迹点使用AP(Affinity Propagation)聚类进行聚合处理,以聚合结果为标准,结合豪斯多夫距离,计算筛选候选划分方式,再设计使用指数机制选择最终聚合方式,使之满足差分隐私保护。再对聚合后的轨迹集添加拉普拉斯噪声,最后经一致性后处理,发布综合轨迹序列数据集。通过算法分析及实验对比,可验证该模型发布的轨迹序列数据集具有较高的数据可用性。本文在多个现实数据集及模拟数据集上,对提出的方法从多个角度进行测试评估,并与当前主流算法进行对比,验证了算法是可行的,具有一定研究意义与价值。
其他文献
本研究以青藏高原冰川慕士塔格冰芯和奎屯51号冰川冰雪为介质,通过分离培养,分析了慕士塔格冰芯微生物的生理特征和csp基因克隆;通过流式细胞计数和构建环境样品16S rRNA基因的克隆文库,分析了奎屯冰川冰雪微生物数量和细菌菌群结构的变化特征及其与气候环境的关系。1.从慕士塔格冰芯分离菌株中选取了5个代表菌株,分别对这些菌株的生长温度和酸度范围进行了观测,并利用微生物冷诱导蛋白的保守氨基酸序列,设计
【目的】本研究拟以产甲酸草酸杆菌草酰辅酶A脱羧酶oxc基因克隆为实验材料,构建产甲酸草酸杆菌草酰辅酶A脱羧酶oxc基因核心区重组表达质粒pET-OXC-1(202~351aa)、及其原核表达重组菌,以获得有活性的oxc基因核心区重组蛋白,进而为建立检测机体内分解草酸的草酰辅酶A脱羧酶及其含量的方法提供实验材料,并为预测机体罹患肾结石的风险和及早进行预防研究奠定基础。【方法】本实验以产甲酸草酸杆菌标
细胞培养中的细菌和支原体污染,特别是支原体污染一直都是细胞培养的难题。污染了细菌和支原体的细胞,虽然一般选择废弃,但有些重要的细胞依然需要靠清除污染来挽救。鉴于细胞培养的污染清除中存在的诸多问题,本研究以BHK-21细胞、抗菌药Baytril、大肠杆菌、猪鼻支原体为研究对象,用96孔细胞培养板,采用10倍分级稀释法,测出抗菌药Baytril对BHK-21细胞的最小抑制浓度为60-80PPM。用同样
几十年来,研究人员一直致力于开发能够模拟人类皮肤功能的触觉感知技术,制备拟人电子皮肤。电子皮肤融合了高度多样化和跨学科的专业知识,其中柔性传感器是电子皮肤实现触觉感知功能的关键部件。然而,柔性传感器的发展却存在着许多挑战与困难。首先,柔性传感器需要具有可穿戴性,并且能够适应于不同形状的表面,同时也需要具备生物相容性、耐用性和耐磨性。第二,柔性传感器需要实现在复杂环境下的适用性,能够区分多种不同的外
电解加工以离子去除的方式实现对零件的加工,理论上具备高精度加工的潜能,而且没有加工作用力和工具损耗,不受工件硬度影响,因此非常适合进行微细加工。但在实际电解加工中,因为电解液良好的导电性,很难控制电解反应发生在工件表面指定的加工区域,从而产生杂散腐蚀,导致加工精度不高,限制了微细电解在实际加工中的应用。微细电解加工常以铣削方式进行,工具形状多为棒状阴极,对棒状阴极侧壁进行绝缘是提高微细电解加工精度
蜿蜒屈曲纤维作为一种类似弹簧结构且具有x/y单向延伸效果的超延展性材料,已被广泛研究并应用在可拉伸/柔性电子器件和微光纤的制造中。然而,蜿蜒结构在生物组织工程支架制造领域的研究尚未得到很深入的研究,且要实现微尺度高一致性蜿蜒结构的精确制造,仍然是一个巨大的挑战。主要是纤维的结构、形貌、力学性能等参数难以实现实时闭环控制,现有的制备工艺限制了纤维支架微结构的精确制造。因此,亟需一种能稳定、精确地制造
随着互联网技术的发展,移动设备已经成为我们工作生活必不可少的工具,保障移动应用的数据安全成为亟待解决的问题。作为一项有效的安全技术,区块链成为可行的解决方案。由于硬件的限制,移动设备无法承载区块链工作量证明所需的算力,移动边缘计算被提出用来解决这一问题。因此,如何设计一个有效的卸载机制,对异构的边缘计算资源进行分配,激励边缘服务提供商和移动设备参与资源市场交易,并在满足经济学性质的前提下最大化系统
同时定位与地图构建(SLAM)是机器人移动导航的核心技术。在SLAM系统框架中,稠密地图能为机器人提供完整的环境信息,是机器人实现定位、导航和避障功能的关键基础,因此构建稠密地图在SLAM中占据非常重要的位置。而当前稠密建图多基于静态环境提出。实际中,由于动态物体(如行人、车辆)的存在,基于静态物体构建的稠密地图的质量由此大幅下降。解决动态环境下稠密建图的问题具有十分重要的意义。在总结前人工作的基
越来越多的研究和实验表明,长非编码RNA(lnc RNA)在人类各种生物过程的发生、发展中起着关键作用,并与多种复杂疾病存在联系。挖掘lnc RNA与疾病之间的潜在关联,探索lnc RNA在疾病发展过程中扮演的“角色”,对于疾病致病机理在分子水平上的理解和疾病的预防、诊断、临床治疗具有重大意义。近年来,基于机器学习算法的lnc RNA-疾病预测模型被提出。此类模型通常利用已知的lnc RNA生物学