【摘 要】
:
如今大数据学习日渐兴起,数据信息的获取和更新都变得异常迅速,因此如何高效的处理数据成为学习理论的研究热点。而分布式学习因其并行计算和保护隐私的特点,为大数据的学习
论文部分内容阅读
如今大数据学习日渐兴起,数据信息的获取和更新都变得异常迅速,因此如何高效的处理数据成为学习理论的研究热点。而分布式学习因其并行计算和保护隐私的特点,为大数据的学习提供了一种高效便捷的新方式。分布式学习的基本思想是把一个超大的数据集?z i?Ni(28)1以等分或不等分的方式拆分成m个互不相交的部分分别存储到m个数据处理器中,每个部分先被单独并行的进行处理分析,然后把处理结果再聚合在一起。基于分布式学习的算法优势,本文将主要从算法理论方面研究基于相关抽样的分布式算法和基于流数据的正则化最小二乘算法。针对基于相关抽样的分布式算法,我们利用积分算子方法和一种新的误差分解方式,证明了当样本序列满足?-混合条件且?-混合系数满足多项式衰减时,可得到算法的误差界与渐进收敛速率。针对分块流数据的正则化最小二乘算法,我们用排一法和积分算子方法,导出了当样本集等分或满足多项式递增时,通过自适应的调整正则化参数可达到最优的学习速率。本文的内容主要分为如下几章:第一章介绍了统计学习理论的发展历程和理论框架。第二章首先介绍正则化算法的相关理论和研究现状,包含了正则化最小二乘算法和系数正则化算法;然后介绍分布式学习的相关理论和研究现状。第三章介绍了本文研究的第一个算法:基于?-混合条件的分布式算法,我们采用积分算子方法、误差分解以及利用?-混合条件的基本特征,得到了算法的误差界和学习速率。第四章介绍了本文研究的第二个算法:基于分块流数据的核岭回归算法,我们利用排一法和积分算子方法证明了当样本集等分或者多项式递增的情况下,通过自适应的调整正则化参数得到了最优的学习速率。第五章总结本文主要的研究结果,提出下一步工作计划。
其他文献
海藻酸钠降解得到的聚甘露糖醛酸(Polymannuronic acid,PM)和聚古罗糖醛酸(Polyguluronic acid,PG)具有优良的生物活性。二者生物活性的发挥与其给药方式密切相关,而口服给药系统是各种给药途径中最广泛使用的方式,因此阐明PM和PG的口服转运过程对其生物活性的发挥具有重要意义。药物的口服转运途径主要包括跨细胞途径和细胞旁途径:多糖由于分子量(Molecular we
股票价格及趋势预测是金融智能研究的热门话题。一直以来,各种各样的信息源被不断尝试用于股价预测,例如基本经济特征、技术指标、网络舆情、财务公告、财政新闻、金融研报等
为探讨河北省夏播早熟区大豆的高产优质栽培措施,在保定和青县采用裂区设计方案,研究了4种施肥水平和4个种植密度对大豆农艺性状、产量和品质的影响。结果表明,不同施肥水平
设计市场和餐饮行业的迅速崛起,人们的思维方式较以往有了很大的变动,更加前卫,人们选择就餐地点时,不只局限于味蕾的感受,还重视了视觉感受,对餐饮空间的设计有了心理期许。
老年痴呆是一种慢性进行性神经衰退疾病,目前西医学对该病尚无突破性治疗,中医药在防治老年痴呆方面取得了良好的疗效。中医学讲求整体观,认为人体是一个有机的整体,五脏是人
心脏瓣膜的形成是脊椎动物心脏发育过程中的重要环节。心脏瓣膜的发育异常会导致心功能不全,是人类先天性心脏病的常见表征之一。经典Wnt信号通路在心脏发育的不同时期分别作
中学生运用数学工具解决物理问题的能力大都不高 ,主要表现在 :一是学生缺乏对物理概念的深入理解 ;二是学生缺乏运用数学工具解决物理问题的策略和方法的训练 ;三是学生思维
<正>目的:甲状腺自身免疫异常(thyroid autoimmunity,TAI)在育龄女性中非常常见,特指甲状腺自身抗体阳性的异常状态。业已证实,TAI及其所致的甲状腺功能异常可能与不孕、妊娠
阿司匹林具有解热、镇痛及抗炎的功效,为非甾体类抗炎药[1]。目前有大量循证医学证明,阿司匹林尚具有抗血小板聚集的功能,是临床广泛应用的抗血小板及防治心脑血管事件的最佳
研究了某小型倾转旋翼无人机模态转换阶段的飞行控制问题.基于鲁棒H∞控制,给出了一种模态转换飞行的增益调度方法,其设计条件具有线性矩阵不等式(LMI)的形式.针对模态转换飞