【摘 要】
:
移动互联网和智能终端设备可以产生大量的高维数据,这些数据具有潜在的规则和价值。然而,如果不经净化处理直接发布,可能会泄漏用户或组织的隐私信息。现有的高维数据差分隐私发布方法不能够较好地保护用户隐私。一方面,中心化差分隐私无法解决不可信服务器导致的隐私泄露问题,以及应用于众包场景存在诸多问题;另一方面,差分隐私作用于高维数据上不仅会引入大量的噪声,降低数据效用,也会产生时间复杂度高、计算复杂等问题。
论文部分内容阅读
移动互联网和智能终端设备可以产生大量的高维数据,这些数据具有潜在的规则和价值。然而,如果不经净化处理直接发布,可能会泄漏用户或组织的隐私信息。现有的高维数据差分隐私发布方法不能够较好地保护用户隐私。一方面,中心化差分隐私无法解决不可信服务器导致的隐私泄露问题,以及应用于众包场景存在诸多问题;另一方面,差分隐私作用于高维数据上不仅会引入大量的噪声,降低数据效用,也会产生时间复杂度高、计算复杂等问题。此外,多数方法在扰动数据时未考虑到属性的关联性,进一步导致信息损失。为解决上述问题,本文考虑众包场景下的数据收集与发布,提出一种基于随机响应和马尔可夫网的高维数据发布机制 HDPRM(High-Dimensional Data Publishing Mechanism Based on RR and Markov Network)。主要内容如下:首先,对于本地用户数据,采用随机响应的方法,通过构建基于阶梯机制的扰动矩阵对数据进行扰动,提出一种满足ε-LDP的算法以提供本地隐私保护,并理论证明该算法的可用性。其次,为了减少计算开销并尽可能保留属性的关联性,使用互信息获得属性之间的关联性,并根据该关联性构建马尔可夫网络,通过联结树算法降低数据的维数;为了提高数据的可用性,通过EM算法重构属性之间的联合分布,根据属性的联合分布和边缘分布对数据进行采样以生成最终的合成数据。最后,通过实验验证所提算法的性能,并将其与RRPP和Invariant-PRAM两种方法作对比分析。实验结果表明,当数据量较大以及隐私预算较小时,HDPRM在提高数据效用方面具有更好的优势。此外,为了更好地进行探讨,采用贝叶斯网作为参照,详细分析两种方案的优缺点。由于贝叶斯网相较于马尔可夫网更为复杂,因此计算复杂性更高,而采用马尔科夫网可以在减少计算开销的同时可以达到与贝叶斯网接近的效果,因此本文提出的方案更为实用。未来考虑将本地差分隐私应用于非关系型数据库及大数据计算框架中,让差分隐私技术得到更广泛的应用。图17表1参65
其他文献
目的:卡介苗(Bacillus Calmette-Guerin,BCG)作为目前唯一广泛应用于临床预防结核病(tuberculosis,TB)的疫苗,其保护力随年龄增长呈下降趋势,尤其对预防成人TB效果不佳。鉴于我国BCG接种覆盖面广,研究BCG初免后的增强型TB疫苗迫在眉睫。我们根据结核分枝杆菌(Mycobacterium tuberculosis,M.tb)基因组不同基因在其特异性和致病性上的
随着长三角区域一体化上升为国家战略,安徽省的经济发展将会得到进一步提高。城市的发展势必会对区域内现有的资源造成一定的影响,相反,区域内现有的资源也会制约城市经济社会的可持续发展。城市水资源作为承载经济社会发展的重要因素之一,关系着人们的日常生活,关系着区域内产业的生存与高质量发展,关系着社会的和谐与进步。可见,分析评价地区水资源承载力变化特征,采取有效措施应对水资源承载经济发展中的问题,对于合理规
施工组织设计的合理编制和实施,能够在符合相关的建设法规和满足建设单位的要求之上有效地改善施工单位自身的经济效益。本文以淮安东站综合客运枢纽工程站前广场进行施工组织设计为主要研究内容,结合国内外有关施工组织设计的研究成果,根据淮安东站综合客运枢纽工程站前广场施工特点、工程管理目标等情况对施工进度安排、施工资源配置、施工平面布置、主要工程施工方案等作出具体的施工组织与规划。基于层次分析法和模糊综合评价
硒是人体必需的微量元素,缺失或过量都会对健康产生不利影响。硒在土壤中分布极不均匀,而当前国内外研究多关注富硒或过量地区,采集的土壤多选自普通农用地,相关的分析以单一行政区域为研究单元,未体现地域的差异性。而研究硒在不同地域内分布规律、揭示土壤富硒特征,对于指导富硒农业产业宏观规划和富硒土地资源开发利用具有重要意义。本文以旱作区农田和矿区复垦农田为研究对象,借助变异函数、冷热点分析、地理探测器等方法
目的探讨腹腔镜辅助经肛门全直肠系膜切除保肛根治术—人工吻合法在低位直肠癌保肛治疗中的应用,分析其手术时间、出血量、淋巴结清除数、远切缘距肿瘤下缘距离、患者术后术后3个月及6个月肛门功能Wexner评分、手术效果、术后并发症、术后1年及2年生存率和肿瘤复发率。方法匹配研究,同济大学附属第十人民医院胃肠外科,从2018年11月至2020年11月,根据手术适应症及意愿接受腹腔镜辅助经肛门全直肠系膜切除保
该论文主要设计并制备出层状硅酸镍(NiPS)及其纳米杂化材料,并将其引入环氧树脂(EP)作为功能填料,制备出EP纳米复合材料。首先通过各类现代测试技术对所制备的纳米填料进行微结构、热性能和成分的表征,而后针对填料的含量对复合体系的摩擦磨损特性、力学性能、燃烧行为和固化过程的影响规律进行了详细而充分的研究,主要研究结果如下:(1)以气相二氧化硅(SiO2)作为硅源以及硬模板,以硝酸镍(Ni(NO3)
无线传感器网络WSN凭借其自身所具有的低成本、自组织、长生存周期等优势,广泛应用于电网监测、海底勘探、军事管理、医疗护理等领域。但是无线传感器网络工作环境复杂多变,传感器能量受限且不能补充,因此无线传感器网络的核心研究问题便是网络覆盖优化控制,可以说网络覆盖控制决定了 WSN的性能和服务质量。采用高效合理的网络覆盖控制策略,能够优化传感器节点的部署,从而使WSN更好的服务于用户。故本文针对二维网络
奇异微分系统是微分方程与动力系统的一个重要领域,其在应用数学、天文学、物理学以及生物学科中有着广泛的应用。因此,探讨奇异微分系统周期解问题具有很高的学术价值。本文应用重合度延拓定理、上下解方法、三阶近似方法、平均方法研究了几类奇异微分系统周期解的存在性和稳定性问题。全文的组织结构如下:第一章,绪论,简述奇异微分系统的背景、研究现状和意义。同时给出了重合度定理、上下解方法、三阶近似方法、平均方法一些
因果中介分析是通过中介变量识别解释自变量和因变量之间关系的因果机制。目前,中介分析的研究主要集中在自然直接与间接效应推断,很少进行效应的估计与分布的研究。本文分别在简单中介模型、具有混杂变量的中介模型、具有交互作用的中介模型和具有多个中介变量的中介模型下进行了自然直接与间接效应估计,并由Delta方法获得了估计量的分布。论文的主要工作包括以下四个部分。第一部分对单个中介变量情形,运用线性回归建立自
随着现代通信技术的发展,对相关元器件的需求也越来越大。这些年,微波介质陶瓷发展迅速,是因为由其制作的微波元器件,有不少优点,例如小巧、经济、质量轻、性能稳等,因此可以满足现代通信工具的小型化、集成化等要求。低温共烧陶瓷(LTCC:Low Temperature Co-fired Ceramic),是一种多层电路,由未烧结的流延陶瓷材料叠层在一起制成,内置印制互联导体、电路和元件,该结构被烧结成一个