【摘 要】
:
线性回归是一种通过对数据进行分析从而科学可靠地预测未来的方法,可以很好的协助企业或者机构更好的进行管理或者决策,而不是依靠经验和直觉等传统的方式。作为机器学习与数据挖掘领域当中最为经典的基础算法,线性回归中涉及到的线性计算在其它学习算法中也有着很重要的体现,比如逻辑回归、神经网络等。所以研究计算过程具有代表性的线性回归算法是非常有意义的。随着大数据时代的发展以及人们对线性回归目标模型性能要求的提升
论文部分内容阅读
线性回归是一种通过对数据进行分析从而科学可靠地预测未来的方法,可以很好的协助企业或者机构更好的进行管理或者决策,而不是依靠经验和直觉等传统的方式。作为机器学习与数据挖掘领域当中最为经典的基础算法,线性回归中涉及到的线性计算在其它学习算法中也有着很重要的体现,比如逻辑回归、神经网络等。所以研究计算过程具有代表性的线性回归算法是非常有意义的。随着大数据时代的发展以及人们对线性回归目标模型性能要求的提升,越来越多的企业或者机构希望利用大规模的数据集进行模型训练,但是本地资源不足的缺陷无法满足计算要求。而云计算服务根据其按需部署、灵活性高、可扩展性的特点,作为数据和计算外包的经济解决方案越来越受欢迎,支持对共享存储和计算资源的即时访问,因此它逐渐被许多组织采用。同时,云服务是不可信的,对数据安全具有潜在的威胁,将数据存储在云上引起了安全和隐私方面的担忧,因为云服务提供商不仅可以访问数据,还可能与其他各方共享数据。这使得数据隐私无法得到保证。所以,研究具有数据隐私保护特性的线性回归算法是必然趋势。针对以上问题的一个很好的解决方案是安全多方计算,安全多方计算主要解决多方之间的计算隐私问题,可以方便各计算方共同解决一个函数,并且不会泄露各计算方的私有信息,因此可用于解决现实世界中的许多问题,而且在很多领域基于该技术提出了相关的方案。目前关于线性回归的数据隐私保护方案已经提出了很多,但是仍然存在一些挑战,即计算通信开销以及准确度之间矛盾问题的平衡,这也一直是隐私保护机器学习领域的一个探索方向。本课题基于秘密共享技术下小批量梯度下降算法的两方协作计算路线,对安全两方计算环境下的数据隐私保护线性回归算法进行研究,主要完成工作如下:(1)提出了基于Paillier同态加密的隐私保护线性回归方案AHM_LR。鉴于数据提供者本地计算和存储资源的有限性以及云计算平台的不可信性,本课题在秘密共享的技术前提下,使用两个非共谋云服务器安全的进行线性回归任务,考虑到数据以及模型参数均以秘密共享份额的形式存储在两个非共谋云服务器中,那么在使用梯度下降方法进行模型参数更新时,需要确保双方的秘密共享份额信息不会被泄露,因此基于Paillier同态加密提出了秘密共享值的加性同态乘法计算AHM协议,并将该协议引入线性回归任务中,实现了基于两方计算的数据隐私保护线性回归算法。实验表明,该方案在保证模型准确度的情况下,实现了数据及模型参数的隐私保护,并且保证了训练和预测过程的高效性。(2)提出了基于随机数据扰动的隐私保护线性回归方案RPM_LR。由于同态加密的加解密操作不可避免会带来较高的时间开销,因此针对秘密共享值之间的乘法计算,跳出同态加密体系,避免同态加密算法的加解密操作,结合Bose的数量积符号计算单向协议,将其扩展到适用于小批量梯度更新算法的矩阵形式,提出了基于随机数据扰动的数据隐私保护线性回归算法。实验表明,RPM_LR方案比AHM_LR方案在时间性能方面得到了很大的优化。本课题实验验证部分使用可用于回归任务的典型数据集Boston和Diabetes数据集,实验结果表明,AHM_LR方案在保证数据和模型参数隐私的同时,训练的线性回归模型与常规模式下的评价结果几乎相同;而RPM_LR方案不仅实现了线性回归算法的数据隐私保护,而且在达到与AHM_LR方案评价结果相同的情况下,将数据隐私保护线性回归算法的时间性能提高了99.93%,使得效率得到了显著提升。
其他文献
现如今物联网的发展速度已经超出了人们的想象,万物互联已经是大势所趋,人们身边已经充斥着各种各样的物联网应用成果,家中有智能家居,农业有农业物联网,工业有工业物联网,汽车有车联网,学校中有教育信息化。针对高校而言,物联网的发展给学校带来了新的提升教育信息化水平、减少能源浪费的机会。论文以此为背景,设计了一个基于物联网的云数据采集分析控制系统,通过在教室安装智能设备(如日光灯、空调、投影等),以及多种
目前国内陆基工厂化养殖模式得到大力推广和发展,智能机械化设备也在养殖任务中发挥重要的作用。水产养殖中,鱼粪、残饵及微生物菌群等物质会附着在池底和池壁上,影响水质导致病害发生,需要定期的予以清除。传统清洗方式需要人工手持板刷或者拖着水枪机四周环绕清刷,工作繁琐重复且池底易滑,也不符合节能环保的理念。本文的研究对象—鱼池清刷机器人主要用于养殖车间的鱼池池底污染物清理,解决了人工清洗存在的问题,清洁效率
在世界各国进军海洋的进程中,水下作业装备扮演着极其重要的角色,水下机器人作为目前普遍使用的海洋探测作业装置,在民用和军事两大领域的相关海洋活动中,发挥着不可替代的关键作用。水下机器人控制技术作为控制理论在水下作业工程装备方面的具体应用,对水下机器人尤其是自主水下机器人的发展具有重大影响和深远意义。自主水下机器人控制技术的研究方向主要涵盖构建控制系统体系结构、动力学建模与模型的合理简化及相关参数的优
在计算机视觉领域,关于深度学习的研究逐渐增多,其发展也日新月异,特别是在人的面部包括生物特征和表情识别、头部姿态估计、活体检测等领域的应用广泛。日前,在社会发展的需求和促进下,各式各样的计算机技术在不断地被发掘,其中,计算机视觉中的头部姿态估计研究已经成为该领域的一大热点。国内外众多的科学研究院、大学实验室、公司研究机构等陆续都在开展对头部姿态估计的研究,将深度学习应用于头部姿态估计算法,旨在提高
船舶在航行过程中船体表面会附着贝类和藤壶等海生物,船体表面附着物的存在会对航行产生不利的影响。经过研究表明,海生物附着在船体表面会增加船体表面粗糙度,增大船舶航行阻力,增加了运输时间和运输油耗,造成经济损失。目前,潜水员用清洗枪对水下船体表面进行清洗是主要的方式。潜水作业劳动强度大,安全性低,清洗成本高,效率低且受天气影响大。为了解决上述问题,可代替人工的清洗爬壁机器人成为了热门研究方向。清洗爬壁
本文主要研究混合图上最小-最大圈覆盖问题。依据不同的覆盖对象,具体分为两种情形:一是覆盖对象仅为弧的情形,二是覆盖对象既包含弧又包含边的情形。该类问题是计算机科学和运筹学中一个重要的组合优化问题,它和它的变形在诸如快递配送、垃圾回收、积雪清理等相关领域具有广泛应用。因此,对其进行科学研究具有重要的理论和实际价值。本文主要从近似算法的角度对其开展研究,针对两种情形,分别给出了较好的近似算法,具体内容
随着近年来人们对水产养殖的关注度增多,鱼类检测与识别对水产养殖业的环境监控、渔业发展等起到关键性作用。目前,水下目标识别技术已成为探索水产养殖业的重要部分,而对水产养殖浑浊水域鱼类的精确识别是渔民经济收益的保障。并随着行动摄像机和无人水下设备等水下记录设备的可及性提高,使得能够高效、安全地拍摄,而不存在通常人工数据收集时带来的后勤困难。然而,水下设备收集了大量需要手动处理的图像数据,对目标识别带来
深海区域占全球海洋面积的90%,超过一半的国际贸易都是通过海洋进行运输。浩瀚的海洋在促进人类文明、经济发展的同时,也留下了众多的人类遗址、遗迹和遗物。我国古代拥有辉煌的海上贸易历史,进行深海遗迹考古与发掘一方面可以推进我国先进海洋装备的研发与进步,另一方面也可以重现历史还原当时社会形态,对发展深海探测技术和传承发扬传统文化具有重要意义。为实现水下考古机器人近距离海底精细化目标检测,本论文以关键帧提
糖尿病视网膜病变(DR)是临床常见的眼病,是导致全球失明的主要原因之一。随着我国人民生活水平的提高,糖尿病视网膜病变的发病致盲率明显增高,其严重影响着患者的视力功能和生活质量。糖尿病黄斑水肿(DME)是导致糖尿病患者视力损害的常见原因。糖尿病黄斑水肿(DME)的早期发现和监测对于治疗糖尿病视网膜病变,预防患者视力损伤具有积极意义。光学相干断层扫描(OCT)是一种无创和无接触的成像方法,可提供视网膜
渔船监控系统(Vessel Monitoring System,VMS)是一种集渔船定位、网络通讯、地理信息、数据管理、电子信息显示等技术于一体的渔船综合应用系统。我国以具有自主知识产权的北斗导航系统为基础,构建了北斗渔船监控管理服务系统。目前,北斗VMS提供渔船报位经纬度、发报时间、速度、航向等信息的时间分辨率3min,空间分辨率10m,高精度的船位信息,可在渔船航迹识别、捕捞状态识别、作业区域