基于本地化差分隐私的社群搜索隐私保护研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhang444051115
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社群搜索已经广泛用于好友推荐、事件组织与活动举办和基于地理与社交的数据分析等基于位置的应用场景中,但是社群中包含大量的用户信息,如果对社群搜索进行不当的利用,用户的社交好友关系、签到行为喜好甚至其他隐私信息都会被泄露,采取措施保护用户的原始数据,消除社群搜索应用存在的隐私泄露隐患,对保证用户的安全具有重要意义。分析了仅对用户的社交关系或签到数据采取隐私保护后,社群搜索仍然存在的隐私泄露问题,提出了基于本地化差分隐私的社群搜索隐私保护方法,其中永久性随机响应邻接矩阵法用于扰动社交数据,局部范围梯度随机响应法用于扰动签到数据。永久性随机响应邻接矩阵法将可信应用、用户本地端和服务提供商结合起来,协作处理用户的社交关系数据,可信应用将用户的原始社交关系转化成邻接位向量发送给用户,用户在本地端对自己的社交关系邻接位向量进行永久性随机响应的扰动,服务提供商在收集完用户的社交数据后获得完整的社交邻接矩阵,并将邻接矩阵转化成社群搜索应用所需的社交关系网络。局部范围梯度随机响应法同样作用于用户的本地端,对签到位置进行扰动,用户的每一次签到都可以自行设置扰动范围,并在该范围内选取k-1个假位置以组成位置候选集合,在获得假位置候选集后用户采用梯度随机响应法选取一个位置作为签到数据的扰动结果。在分析证明安全性的同时,考虑了数据效用优化问题,给出了两个算法在平衡隐私性与数据效用性时的隐私预算取值,并且面向社群搜索应用估计了扰动数据的社群签到密度。为了验证方法的有效性,设置了五个数据评价指标在三个真实的用户数据集上进行实验,并且与现有的社交关系扰动方法和签到数据扰动方法作对比,列出了实验结果并进行分析。实验结果表明,永久性随机响应邻接矩阵法和局部范围梯度随机响应法在数据可用性指标上都优于对比算法,较好地平衡了安全性和数据可用性。
其他文献
随着信息技术的快速发展,金融行业与互联网的联系日益紧密,使得金融领域产生了海量的非结构化文本。关系抽取技术能有效提取金融文本中实体对的关系信息,是构建金融知识图谱的重要环节。有监督关系抽取方法依赖于大量人工标注的数据,而在金融领域由于标注问题缺乏相关数据集,因此研究无监督关系抽取方法对于构建金融知识图谱具有重要意义。而金融文本中存在句式结构复杂、领域词汇多、实体名称长等特点,使得面向金融文本的关系
学位
人脸识别系统能够正常工作的前提是构建好系统用户的底片库,在人脸识别系统工作过程中,先要从底片库中加载人脸特征,为识别提供比对的样本。底片库作为人脸识别系统的基础,对整个系统的识别准确率有很大的影响。当前构建人脸识别系统底片库大多使用人工筛选的方法,耗时耗力,且存在误筛和漏筛的现象。针对这种情况,有必要实现一种自动构建人脸识别系统底片库的方案。底片库构建技术分为三个模块:人脸图像检测、人脸图像质量评
学位
随着医疗大数据的快速发展,可解释机器学习模型被广泛用于医学领域。医学学习模型的公平性问题将影响针对不同患者群体的危险因素分析和疾病预测结果,已引起业界高度关注。然而,如何构建能够有效划分患者群体的“公平”模型,并据此给出对临床诊疗真实有效的危险因素与预测结果间关系仍是医学学习模型的痛点和难点。通过对医学学习模型公平性问题的深入分析,发现了由混杂因素带来的机器学习公平性问题。针对这一问题,提出了基于
学位
核磁共振测井技术是一门崭新的、在二十世纪发展迅速的测井分析技术,它不仅可以对岩石总孔隙度进行计算,还可以定量地计算有效孔隙度、束缚水孔隙度以及渗透率等数据,在储层流体识别、孔隙结构识别与复杂地层油气藏评价等方面具有十分显著的优势,已成为石油勘探测井方面不可或缺的一个重要技术。基于对核磁共振测井相关知识的研究,改进了奇异值反演算法,与联合迭代反演算法和阻尼因子反演算法对比,通过正演模型验证了算法的有
学位
如何从海量的互联网数据中提取出实体关系是信息抽取亟待解决的问题之一。关系抽取包括句内关系抽取和文档级别关系抽取。在文档级别的关系抽取任务中,输入文本序列长且由多句话组成,同时实体往往位于不同句子中,因此需要多句子共同推理才能得出实体对之间的关系。相比句内关系抽取,文档级别关系抽取面临诸多挑战,如文本特征提取不充分、跨句推理能力不足等。对此,研发了融合多维度与上下文特征的关系抽取系统。在该系统中,针
学位
中国式农村教育现代化发展道路需要有自身的理论建构。中西比较维度下对西方农村教育现代化道路与理论的批判与超越成为建构中国化理论的起点,这一维度要求中国式农村教育现代化理论要打破西方意识形态偏见,探索不同于西方的本土现代化模式;以世界先进水平为标准定位教育现代化,积极推进教育强国建设;破除路径唯一性幻象,探索传统与现代共存、乡土化与城市化并进的新型农村教育现代化之路。历史变迁维度下对中国式农村教育现代
期刊
冠心病是最常见的心血管疾病,给居民带来严重的健康问题和经济负担。冠状动脉分段标记可用于冠心病的病理分析,对冠状动脉血管造影图像中不同类别的血管段应用不同权重,计算解剖结构分支的统计数据。冠状动脉分段标记得越精确和细致,越有助于自动量化冠心病的复杂程度,加快医生分析工作的流程时间。目前,大多数基于深度学习的分段标记方法能够自动对冠状动脉完成分段,但是存在分段类别过少的问题,无法识别不常见的分支。冠状
学位
联邦学习允许参与者在不共享数据的前提下协同训练模型,由于其很好地保护了用户数据隐私并打破数据孤岛,逐渐成为了国内外研究人员的关注热点。联邦集成蒸馏(Federated Distillation and Fusion,Fed DF)算法是联邦学习中一种现有的高效中心聚合算法,该算法以外源数据为蒸馏数据,对初步参数平均聚合得到的模型再蒸馏来提高模型的预测准确度。但在实际场景中外源数据难以获取,且在训练
学位
新型冠状病毒肺炎是一种严重危害世界人民健康甚至生命的疾病。对新冠的研究有多个方面,其中,患者在治疗过程中病情变化规律的研究,是一个重要的问题。根据患者治疗中的指标表现,可将其分为普通、重症、死亡3种程度,病情的变化规律指的是患病程度如何变化。根据临床实际治疗样本,总结了四种新冠患者病情变化规律:普通仍然普通、普通变成重症、重症变成普通、重症变成死亡。现阶段统计了上述四类患者的临床数据,包括病人肺部
学位
随着我国医疗科技的飞速发展,人们对医疗服务的需求和依赖也呈爆炸式增长,在这个过程中,不可避免地滋生出了许多治疗不规范、费用不合理的情况。为了能够提高医疗质量、控制医疗费用,临床路径与疾病诊断相关分组(Diagnosis Related Groups,DRG)作为一种有效的技术手段开始被广泛使用。但是其依然存在着数据容易被篡改、医疗异常无法及时被发现以及出现医疗事故后无法查询出详细信息和定责等问题。
学位