大数据分布式在线学习算法研究及其隐私保护

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:olddai1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今这个大数据的时代,越来越多的生产和活动被数据化到网络和数据库上。这些大数据记录了人们生活的方方面面,研究这些数据会发现许多有价值的信息。诸如沃尔玛超市将尿布啤酒放在一起买的例子就不多说了。大数据在医疗和商品推荐方面的应用更是具有极大的商业价值。在使用大数据之前我们需要了解到现今数据表现出来的一些特征。由于现今互联网的普及,数据显示出分布广泛、更新快速、高维度和隐私性的特点。为了解决这几点问题,本文提出了一个具有隐私保护的分布式在线学习框架来对这些数据进行挖掘学习。本文假设在这样一个场景下:数据的收集与存储是分布在不同的数据中心;由于隐私保护的原因,不同数据库是不能进行原始样本数据的交换;但是为了充分发掘数据中的价值,各个数据中心必须协同合作完成研究。为了解决在上述场景下的数据研究,那我们必须赋予每个节点(数据中心)根据本地数据进行独立学习处理数据的能力。节点之间只能交换计算中的中间变量。本文首先研究的就是如何在有限交流的情况下是的整体节点目标优化函数收敛大一起。伴随着数据交流必有隐私泄露的风险,因此我们有考虑在分布式计算引用差分隐私来保护数据的安全。本文主要的贡献在于理论上数学证明的这种分布式计算的可行性和安全隐私保护的级别。并且做了大量的实验验证理论推导的正确性。最后,本文根据实际场景,对我们的算法提出了两点拓展应用。一是将分布式在线学习的计算结果可以转化为相应的离线算法收敛结果;二是采用mini-batch的方法增加每次迭代使用的数据样本数量,加快计算效率并提升隐私算法的效用性。本文研究工作已发表国际两篇国际学术会议论文和一篇知识挖掘A类期刊TKDE。
其他文献
随着黑龙江省农田种植结构改变,从大面积种植大豆改成现在的大面积种植玉米。烟嘧磺隆的作用靶标酶是乙酰乳酸合成酶(ALS),是一种广谱性的除草剂,是磺酰脲类除草剂中唯一对禾本
目的比较保留乳头乳晕乳腺癌改良根治术后即刻扩展型背阔肌再造术与改良根治术的疗效,并对前者手术安全性、手术技巧等进行分析。方法回顾性分析2009年1月-2012年12月蚌埠医
如今计算机技术突飞猛进地发展,人们生活的方方面面越来越依赖于信息系统,而数据库作为信息的核心载体,其中保存着大量数据,并且越来越多的数据涉及到国家机密等敏感信息,要
模型试验技术已经成为研究和解决基坑问题的主要方法之一,在国内外已得到了广泛应用,并在工程科研、设计及论证中发挥了重要作用。但是国内外相关研究存在着以下主要问题:对
非常感谢董老师的邀请,从前面各位嘉宾的演讲中,我也学到了很多东西。我想今天我主要的分享内容还是我们的主题,受托人责任。第一个话题是英美法系的资本市场为什么更发达?第
会议
我国工业系统发展迅速,高精度的机械零部件逐渐有越来越大的缺口,螺纹工件是一种机械行业中常见的连接零件,在工业产品中有着广泛应用。由于对螺纹质量要求提高使得外螺纹检测系统发展迅速,融合视觉的外螺纹检测系统因为检测速度快,测量精度高等优点,在螺纹检测系统中占据越来越重要的地位。本文通过研究其他文章提出的外螺纹检测方式,创造性提出了一种新型的考虑轴线倾斜情况下的圆柱外螺纹轴线倾斜牙型修正算法,并根据算法
高中思想政治课课后作业设计作为教学设计中的一个环节,这一环节的设计与实施好坏影响着作业的有效性,优化课后作业设计就是提高作业质量,将课后作业的巩固、监督、检测和调节功能发挥得更好。从课后作业设计自身的角度出发,在新课程改革的背景下,新课程标准不仅对课程提出了新要求,也对教学设计提出了新方向。那么,课后作业设计自然也需要及时更新,适应时代的发展和新课程的要求。从外部因素出发,近几年来社会各界、家长和
党的十九大报告提出,“提高社会治理社会化、法治化、智能化、专业化水平”。司法作为社会治理的重要组成部分,将人工智能技术应用于司法实践是司法智能化的必然要求。面对各领域对人工智能技术的深入探讨,司法领域也不应落于人后。本文综合运用了数据分析、文献归纳、跨学科分析等研究方法,从人工智能的概念出发,了解了人工智能的发展现状。从当前社会中人工智能的具体应用分类方面对人工智能进行了梳理。从节约司法资源、强化
攀爬机器人在高难度、高强度和高危险的作业任务中具有广泛的应用前景。当前,制约攀爬机器人落地的重要原因是其自主定位导航技术尚不成熟。本文主要研究攀爬机器人自主定位导航中的构图模块和定位模块。其中,构图模块包括两部分研究内容:基于同步定位与建图技术构建三维壁面环境地图,以及三维壁面环境的结构化表达方法。定位模块研究实时追踪攀爬机器人位姿的算法。主要内容如下:(1)研究多传感信息融合的攀爬机器人构图算法
对于移动机器人来说,一个基本的场景重建过程包括了环境感知、移动机器人的定位与位姿优化、地图的生成与拼接、重定位等步骤。本文着重研究了其中的环境感知、位姿优化、重定位三个部分,并以此构建了一个完整的移动机器人场景实时重建系统。本文研究了一种基于三目相机信息融合的高精度深度感知算法。传统的基于被动测距的立体视觉算法,常常对环境中的纹理有强依赖性;而深度相机不依赖于纹理,但输出的分辨率较低,且易受环境光