论文部分内容阅读
最优决策选择问题一直是优化中的热点话题。本文首先提出FTL算法来进行最优决策更新,并加入正则化方法以稳定时变的决策。其次,用SP-regret度量累积收益和总收益函数的鞍点值之间的差值,证明了结果能达到次线性。进一步地,将算法推广到存在Byzantine故障的3f+1的网络拓扑中,得到了在拜占庭环境下基于在线鞍点优化的正则化跟随领导者算法BOSP-RFTL。数值仿真结果表明:加入正则化后双方的决策变量能够稳定在一定范围内波动。