基于位置大数据的差分隐私聚类算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:liongliong468
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物联网和智能传感设备的迅猛发展,使得许多领域都发生了革命性的变化,包括电子商务、医疗保健、环境监测、交通和能源。这些低成本的普遍传感设备产生和收集了大量信息数据,为机器学习和数据挖掘等大数据技术提供了良好的发展平台。同时,具有GPS定位功能的IP可视化设备能够将人和物的地理位置数据化,人们可以通过使用位置感知应用程序来进行地图导航、社交软件的位置共享、实时查询交通信息。虽然位置信息为消费者提供了优质的个性化服务,但这些实时记录用户位置和移动轨迹的数据传入到互联网云端后,被恶意攻击者进行挖掘分析,对个人隐私造成极大威胁。因此,需要在已有位置隐私保护研究成果的基础上,设计新的解决方案和算法来应对位置大数据隐私泄露的挑战。差分隐私保护是一种独立于对手先验知识的新范式,能够通过增加随机噪声使数据内部轻度失真,在保持外部统计特性不变的情况下来保护敏感数据。聚类分析可以从大量的没有直接关联的数据中挖掘出有价值的知识和规则,是数据分析处理的重要工具。本文根据位置大数据的结构特性,结合差分隐私和聚类分析二者的优点,提出面向位置大数据的差分隐私聚类方法,主要完成的工作如下:(1)比较分析了近年来流行的位置隐私保护技术,根据它们的性能优缺点研究出位置差分隐私保护模型,给出了混合位置大数据的预处理方法,对差分隐私预算?进行了合理分配。(2)提出了一种面向位置大数据的降维聚类算法RD-means,引入同步轨迹距离的概念来划分聚类簇,再由聚类簇中数据点集的分布状况配置特征权重参数的目标函数,根据临近搜索策略寻找最优的中心点,在簇间替换掉相互重叠的数据记录完成聚类,降低了位置数据的维度和冗余度。(3)在预处理的环境下,设计了一种面向位置大数据的差分隐私聚类算法DPKD,选取k个随机元素添加Laplace噪声让中心点偏移,使其满足?-差分隐私保护机制,同时也取得高效聚类结果。(4)针对位置数据和非位置信息记录分布不均衡的情况,提出一种改进的差分隐私聚类算法Op-DPKD,以原聚类中心点作为参考对象,选取一个新的元素点作为聚类中心进行对比,引入相对误差的比较,遍历搜索到最优的聚类中心,减少了因随机中心点对初始位置过于敏感而引起的距离误差,取得了更好的稳定性和聚类效果。
其他文献
<正>推陈出新,是小家电市场永恒的主题,这种更新换代甚至比时尚界的更替更迅速,很多经典的设计出现后很快被忘记,而新的造型又层出不穷。在每一年的设计中,总有一些能让人眼
目的:节省手术患者身份确认时间,加强可实行性,提高手术中进行安全核查及输血用药前核查患者身份的速度及执行率。方法:在2018年1月-2018年6月本院1295例择期腹腔镜及脐水平
近年来,高压静电雾化技术在日常生活和工业生产中应用越来越广泛。现已应用于工业除尘及脱硫脱硝等环保领域。文章以无动力空腔雾化电极为放电极进行雾化实验,利用PCO高速摄
学习空间的第三自由度是学习共同体中心,体现学校学习共同体中心的学习空间设计应该特别关注学校学习的社会性与生态性条件。通过对社会性与生态性学习环境的分析,指出学习空
11月10日,市十四届人大常委会第三十三次会议听取和审议了市人大常委会主任殷一璀代表常委会执法检查组所作的关于检查本市贯彻实施《上海市住宅物业管理规定》情况的报告。会
针对大学体育教学的特殊性特点,在分析了相关的分层教学理论的基础上,具体探讨了分层教学的方法及要求,并探讨出"分层教学"的原则。且得出了结论,设想了相应的建议性对策,结
目前,动物性食品中的兽药残留受到了人们的广泛关注。要对动物性食品中的兽药残留进行检测,第一步就是要将目标物从样品中提取出来。在已有的文献报道中,常用于样品中兽药残
<正>很多伟大的人,都崇尚极简。极简不光是一种生活方式,更是一种人生哲学。当极简成为实践,就成了一种伟大的力量。乔布斯还在世的时候,在他家里,屋里只有一张爱因斯坦的照
本文以微型轻便式节能型果蔬冷藏库为研究对象,采用香蕉为实验物料,结合SIMPLE算法,运用Ansys Fluent分析方法,探讨三种送风方式对果蔬冷库温度场的影响。结果表明:在研究的
讨论了中小学实验教学安全管理标准制订的必要性与可行性,分析了标准制订的依据,提出了标准撰写的建议。为中小学实验室与实验教学管理标准的建立奠定了理论基础。