【摘 要】
:
聚类分析是数据挖掘和数据分析中的一项主要任务,被广泛应用在生活中,如生物信息处理、模式识别、数字取证、信息检索和目标营销等。近年来云计算迅猛发展,存储/计算能力有限的移动终端设备常常会将大型私有数据集和本地应用(如聚类)发送到云上进行外包存储和外包运算。而现有的云服务器通常是在半可信或恶意的环境下运行,即云尚未可信。因此,如何在聚类的过程中对云端的加密域进行安全高效的代理运算成为了最重要的问题之一
论文部分内容阅读
聚类分析是数据挖掘和数据分析中的一项主要任务,被广泛应用在生活中,如生物信息处理、模式识别、数字取证、信息检索和目标营销等。近年来云计算迅猛发展,存储/计算能力有限的移动终端设备常常会将大型私有数据集和本地应用(如聚类)发送到云上进行外包存储和外包运算。而现有的云服务器通常是在半可信或恶意的环境下运行,即云尚未可信。因此,如何在聚类的过程中对云端的加密域进行安全高效的代理运算成为了最重要的问题之一。同态加密技术支持在不解密的状态下对密文进行指定运算操作,适合用来解决外包运算的隐私保护问题。K均值聚类是一种经典的聚类算法,由于简洁高效被广泛使用。在现有的同态加密k-means聚类方案中:1)没有有效的方法来处理浮点数外包密文的存储和计算;2)没有有效的方法在不解密的情况下进行密文比较;3)没有最大程度降低客户端的计算开销。为了解决上述问题,本文提出了一个基于POCF的浮点数隐私保护聚类外包计算方案,该方案做出了以下三个方面的贡献:1.针对以往的同态加密k-means聚类算法不支持小数计算的问题,本文的工作着重于研究并提出了一种面向浮点数的同态加密外包计算聚类方案,根据K均值算法的具体步骤设计了三个安全子协议。并且在本文k-means算法上引入了一种安全的浮点数存储办法。2.针对以往的同态加密k-means方案中不支持密文比较的问题,利用支持部分解密的Pailiier算法PCPD子协议中的SEQ安全比较运算和POCF子协议中的SFPC浮点数安全比较运算,设计了一种支持完全密文距离比较的SSD子协议,能够在密文中求解出k个距离中的最小距离。3.针对云服务器的半可信特征,在方案中利用通用可组合UC模型证明了协议的安全性。在四个数据集上对我们的隐私保护聚类算法进行了全面评估,实验数据显示:随着样本数量的增加服务器端的开销占比达到99%以上,云分摊了更多的运算任务,给计算资源匮乏的用户端带来了最小的同态负载。
其他文献
近年来,人们已经开始重视如何在日常生活中调养自己的身体,食疗这个话题也时常被提起。科学的进行食疗养生对于身体和人精神的益处是显而易见的,最重要的是它不会对身体造成一些负担。相较于药物治疗,食疗更多的在于提高人体的身体素质,起到更好的预防的作用。食疗的素材例如食物水果等在生活中更容易获得而且相较于药物来说更加物美价廉。再者食疗养生能在潜移默化中改善自身的身体而不会让患者有什么不舒服以及疼痛的感觉。但
区块链技术正在向3.0时代迈进,其在商业上的应用价值成为了政府、机构、相关企业主要的关注、研究热点。联盟链既拥有区块链防篡改、可追溯等特性,又支持与数字货币脱钩、能够受机构或政府监管。因此,不论是从链的性质,还是从政策环境的角度来看,它都是我国把握区块链发展机遇较合适的架构。共识算法用于解决区块链系统的一致性问题,因为它直接决定了区块链的性能、容错率以及正确性,所以是区块链中最重要的技术之一。实用
自从知识图谱的理论方法被引入到我国以来,在社会科学范畴增进敏捷,近期知识图谱的应用在教育范畴和大数据等范畴较多。企业社交图谱的构建,是针对当前年代下大数据环境中企业知识数据资源的有效组织和应用,实现让数据成为生产力。通过学习知识图谱相关的基础理论知识、查看大量知识图谱的相关技术、查看前辈们实现知识图谱相关的项目,最终,实现了本论文的企业社交图谱查询系统。基于购买公司产品的企业,针对用户的需求、数据
随着世界互联网技术的飞速发展,线上支付的应用得到广泛的普及,随着海量交易数据的沉淀,银行积累了大量的数据,包括各类交易类型数据、积分类型信息、客户账户信息等,在这些交易数据当中,其类型具有多样化特点,非结构化类型的数据给数据分析带来很大的麻烦。银行交易的发生必然伴随着不同等级的风险,因此犯罪份子通过银行的安全漏洞去做一些违法交易,如盗刷、伪刷、套积分等,诸如此类的现象频繁发生,给银行行业带来巨大的
太湖流域经济发达,水环境问题突出,是我国十大重点污染治理的流域之一。本研究以太湖流域农业面源污染控制技术和示范工程为对象,梳理归纳“十一五”至“十三五”期间已有农业面源污染控制技术成果,并开展后续跟踪评估研究;在系统研究其对传统污染物的去除效果的基础上,探讨技术应用的长效性规律;同时,研究太湖流域农业面源污染中新型污染物(微塑料)的赋存特征以及典型农业面源污染控制技术对其截留效应,为太湖流域水环境
随着我国金融行业的日益活跃和科技的迅猛发展,各类金融产品(如基金、债券和股票等)的种类和数量逐渐增多,对于投资者而言,如何在以众多金融产品中快速、准确地找到自己需要的产品是一件非常重要且极具挑战的事情。对于拥有海量的用户信息和用户行为数据的证券公司而言,迫切需要充分利用和挖掘这些业务数据的价值,挖掘出用户的偏好,及时向用户推荐合适的金融产品,从而实现交易量和利润的增长。推荐系统可以有效地缓解上述信
为精准治理网络谣言,突破海量信息中谣言监控难点和辟谣信息公众接收困境,并把握提升谣言治理效果的关键,对谣言及舆情精准治理文献进行挖掘,总结研究现状和存在的问题,辨析网络谣言精准治理概念,梳理了网络谣言治理对象-主体-客体结构。提出大数据背景下实现网络谣言精准治理“三向”策略:(1)对治理的对象:网络谣言,加强理性认识,通过大数据挖掘重复出现谣言、大规模扩散谣言的特征,实现抓重-抓扩谣言监控;(2)
受到材料、施工、养护和环境等多方面因素的影响,混凝土结构表面可能产生走向、宽度、深度和程度各异的表面损伤。如果放任混凝土表面的损伤持续发展并继续蔓延,会减小结构的有效载荷,甚至导致结构失效。因此,混凝土表面损伤是混凝土结构健康的重要监测目标之一。人们以前依赖的人工检测方式在进行海量的表面图像处理中,往往存在普适性差、效率不高、识别精度低等许多问题。本文首先对国内外的相关研究工作进行了梳理,总结了现