在线梯度下降算法的动态遗憾分析与应用

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:tnngx123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种广泛使用的在线凸优化方法,在线梯度下降算法通常用来求解在线学习问题。它把在线学习的过程建模为一个连续地博弈问题。博弈的双方分别为学习者和未知环境。在每次博弈时,由学习者先出牌,它根据历史信息给出一个出牌策略,即决策模型。然后由未知环境再出牌,它根据学习者给出的决策模型给出一个损失函数,因此带来了具体的损失。大量的文献研究了在线梯度下降算法以及它的各种变种方法,并分析了它们的性能。相关工作通常使用“遗憾”来度量在线梯度下降算法及其变种方法的性能。它度量了由在线学习方法得到的决策模型与潜在的最优的学习方法得到的模型的距离。已有的相关工作通常假设最优的模型是恒定不变的,即不会随着时间而改变。这样的假设适用于静态的环境,而不适用于动态的环境。在动态环境中,最优的模型并非恒定不变,而是会随着时间而变化。在静态环境中的“遗憾”称之为“静态遗憾”,同样地在动态环境中的“遗憾”称之为“动态遗憾”。尽管已有的相关工作使用静态遗憾已经从各种方面充分地研究了在线梯度下降算法,然而在动态环境中对在线梯度下降算法的研究却十分缺乏。为了弥补这方面的空白,本文系统地研究了动态环境中的在线梯度下降算法,分析了在线梯度下降算法的无转换代价的动态遗憾,并将分析拓展到带有转换代价的动态遗憾,无投影的在线学习场景,以及去中心化场景中的在线学习问题。本文首先分析了在线梯度下降算法在对抗博弈动态环境中的无转换代价的动态遗憾。本文的分析表明当损失函数为凸函数时,在对抗博弈动态环境中在线梯度下降算法的无转换代价的动态遗憾为(?),其中Dβ度量了环境中动态变化的范围,T表示模型经过了T轮更新。本文的分析表明在线凸优化问题的无转换代价的动态遗憾为(?)。因为在线梯度下降算法的无转换代价的动态遗憾与在线凸优化问题的无转换代价的动态遗憾相匹配,本文的分析表明了在对抗博弈动态环境中在线梯度下降算法是求解在线凸优化问题的最优方法。本文继续研究了在线梯度下降算法在对抗博弈以及非对抗博弈环境中的带有转换代价的动态遗憾。在非对抗博弈环境中,在线梯度下降算法的带有转换代价的动态遗价为(?)。其中1≤ζ≤2是转换代价中的常数,D度量了环境中动态变化的范围,T表示模型经过了 T轮的更新。而在对抗博弈环境中,在线梯度下降算法的带有转换代价的动态遗憾为(?)。研究发现了在非对抗博弈环境中在线梯度下降算法的动态遗憾受到转换代价的显著影响,而在对抗博弈环境中在线梯度下降算法的动态遗憾并不会受到转换代价的影响。当动态遗憾中带有转换代价时,研究分析发现在线梯度下降算法是求解动态环境中在线凸优化问题的最优方法。除此之外,本文提出了新的无投影的在线梯度下降算法,用于解决带有非光滑可行集的在线凸优化问题。研究分析了当损失函数为凸函数时它的动态遗憾为(?)。因为在线凸优化学习问题的动态遗憾为(?)。因此本文所提出的无投影的在线梯度下降算法是求解该类在线凸优化问题的最优方法。更进一步地,本文分析并研究了去中心化网络中的在线梯度下降算法的动态遗憾,并分析了它的动态遗憾为(?)。其中G表示损失函数的梯度的范数,σ2表示损失函数中的随机成分的方差,M度量了环境中动态变化的范围。研究分析发现了节点之间的通信交换机制对动态遗憾的影响,发现了该通信机制有助于减小损失函数中随机成分带来的动态遗憾,但是对损失函数中对抗成分带来的动态遗憾却没有影响。最后,本文提出了针对K均值聚类问题的方差减小的随机梯度下降算法、针对分布式机器学习问题的通信高效的随机梯度下降算法、针对“范数和”正则化问题的ADMM方法和对偶方法。大量的实验验证了所提出的方法的正确性和效率。
其他文献
随着经济的发展,城市生活节奏日益加快,自然风景集中地的休闲旅游已成为人们生活的一种方式。而风景建筑作为一种空间载体,既是建筑,又是景观,成为城市与自然的连接点。如何设计既能满足休闲旅游的功能需求,又与自然环境和谐共生而自成景观,这是一个需要深入研究的问题。桂林作为我国典型的风景旅游城市,拥有丰富的自然资源与深厚的人文资源。随着建国以后桂林风景区建设的深入开展,桂林风景建筑建设于1960年代前后形成
改革开放以来,我国成立了家庭联产承包责任制的“两权分置”土地制度,但随着城乡统筹的发展与农业现代化发展,“两权分置”的土地制度无法满足当前社会的需求,农村因为农民的流失,出现大量空心村闲置土地,导致乡村发展不平衡,土地利用不充分等问题。现今新型土地制度“三权分置”政策在国家层面颁出,放活农村土地经营权对乡村的发展带来了新契机。基于此,本文在三权视角下对乡村发展问题进行探索,结合“三权分置”政策实行
在城市发展的历史进程中,城市与景观环境一直以来以一种互动关系共生于一个系统之中,以不同的组合方式创造了不同的城市类型,其中山水城市模式是古今中外公认的城市典范。中国古代营城往往离不开山水环境,视其为城市中必不可少的重要组成部分,而今的城市研究却往往与古人营城所展示出来的山水人居环境思想有所偏差。同时,随着城市化进程的加快,生态环境在城市建设中容易被忽视,过度人工化趋势明显,伴随着地域文化特色的逐步
学位
身份认证是保障网络空间安全的关键机制之一。单因子身份认证方法存在容易被攻击、安全性弱的不足,使用包括用户生物特征在内的多因子身份认证成为当前的主要途径。本文针对多因子认证方案在不同应用环境中所面临的问题,以增加方案的安全性和运行效率为目标,结合零知识证明技术研究多因子远程认证方法。与已有方案在本地认证用户因子的方法不同,我们提出服务器远程直接认证用户多个因子的思路,分别为单服务器场景、移动云计算以
随着现代互联网络技术的快速发展,各种网络应用已经深深地渗透到了社会的每一个角落:从基本的工作应用需求出发,一直延伸到人们的衣食住行,社交和娱乐需求中。丰富的互联网应用在给人们带来多彩生活的同时,却给支撑起这些应用的基础通信网络带来了各种挑战。这些挑战包括:首先,网络规模的不断扩大,网络用户数量的逐年增加,以及通信数据的海量传输,使得不断增加的互联网带宽仍显捉襟见肘;与此同时,网络特性的变化对网络服
科技强则国家强,科技兴则军队兴。依靠创新科技推动国防和军队建设实现新跨越,是为迎接世界局势变化带来的挑战,加速推进中国特色军事变革的必然要求。本研究以演化经济学作为基础理论,结合演化经济学中的适应性原理、复杂系统原理以及耗散结构原理,将国防科技协同创新活动视作一个具有非线性、动态性、多层次性的复杂创新系统。依照演化经济学理论中“新奇”的创生、传播、适应三个演化过程为线索,创造性地将复杂的国防科技协
“兵者,国之大事,死生之地,存亡之道,不可不察也。”战争关乎国家安危,必须运用科学的理论和方法做出正确的决策,作战行动计划质量的高低事关战争的成败,必须运用科学的方法对其进行研究。信息技术的发展使得武器装备系统之间的互联互通更加频繁,作战体系化和网络化的特征愈发明显,尤其是无人装备和集群作战样式的兴起,使得作战体系(Combat System of Systems,CSo S)网络化的趋势更加明显
习主席强调指出,“掌握思想领导是掌握一切领导的第一位。”思想政治教育是我军政治工作的重要组成部分,其根本目的就是要将我们党的精神、意志和主张灌注于官兵的头脑和灵魂之中,从而牢牢掌握官兵思想,确保我军始终置于党的绝对领导之下。当前,随着网络信息技术的迭代更新速度不断加快,各种类型的社交媒体花样翻新、层出不穷,它们一方面因为能够为广大官兵的学习、工作和生活提供极大便利而日益成为广大官兵须臾不可或缺的生
信息系统与信息管理是以信息为核心资源,以信息技术为核心能力,面向宏观与微观各层面的解决经济和管理实际问题的重要科学领域,具有“信息、技术、管理”三个重要维度。信息的爆炸式增长催生了以计算机网络为基础的分布式系统。尽管分布式系统不断演进并得到广泛推广和应用,仍然存在一些基础性问题制约其效能的充分发挥。内容同步技术就是一个典型代表。分布式场景下,都存在不同主机之间需要快速准确的内容同步需求,例如集群节