【摘 要】
:
5G无线技术的快速发展以及新兴物联网时代的加速到来,万物互联、超可靠低延时通信成为大家共同的期待。为了克服移动设备在执行计算密集型工作负载方面的局限性,移动边缘计算(Mobile Edge Computing,MEC)应运而生,能够有效支持计算能力受限和能源受限的物联网(Internet of Things,Io T)设备执行计算密集型和延迟关键型应用程序,成为下一代网络关键技术。近年来,MEC系
论文部分内容阅读
5G无线技术的快速发展以及新兴物联网时代的加速到来,万物互联、超可靠低延时通信成为大家共同的期待。为了克服移动设备在执行计算密集型工作负载方面的局限性,移动边缘计算(Mobile Edge Computing,MEC)应运而生,能够有效支持计算能力受限和能源受限的物联网(Internet of Things,Io T)设备执行计算密集型和延迟关键型应用程序,成为下一代网络关键技术。近年来,MEC系统的计算卸载和资源分配问题引起了学术界和工业界的广泛关注。然而,基于传统优化理论的解决方案通常需要经过复杂迭代,只能得到近似最优解。此外,还需要已知环境的统计信息,而这些信息在实际的MEC系统中很难获取。为了应对这些挑战,目前有大量研究者转而采用马尔可夫决策过程(Markov Decision Process,MDP)建立MEC系统的动态控制模型,并应用基于强化学习(Reinforcement Learning,RL)或深度强化学习(Deep Reinforcement Learning,DRL)的方法解决相应问题。然而,现有研究大部分集中在单个MEC服务器场景,针对多MEC服务器场景下的计算卸载及资源分配问题研究较少,基于此,本文的主要研究工作总结如下:第一,针对多MEC服务器多用户场景,提出了一种联合用户关联、功率分配优化方案,以最小化功耗及排队延迟。首先,在综合考虑随机任务到达、时变无线信道以及MID和MEC服务器队列缓冲的基础上,建立通信及计算卸载模型。然后,以最小化平均长期服务成本(功耗加排队延时)作为优化目标。针对该研究目标,提出了一种基于混合决策深度强化学习的动态计算卸载及资源分配算法,该算法利用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)和决斗双深度Q网络(Dueling Double Deep Q Network,D3QN)来改进Actor-Critic架构,通过调用DDPG的Actor部分来处理连续功率分配。然后将DDPG的Critc部分与D3QN相结合来处理MID与MEC服务器的关联,以解决多MEC服务器多用户场景中混合决策问题。仿真结果表明,所提算法与DQN等基线算法相比,具有更好的稳定性和更快的收敛性。同时在不同的任务到达率下,所提算法的平均系统服务成本明显降低。第二,针对多MEC服务器多用户的云边协作场景,提出了一种联合优化本地计算资源、任务分割因子以及用户关联,以最小化服务延时和能耗的任务卸载及资源分配方案。首先,在综合考虑云边协作、随机信道状态切换、MEC服务器计算资源分配、解码错误概率以及能量采集的基础上建立网络及计算卸载模型。然后,以最小化平均长期服务成本(服务延时加能耗)作为优化目标。针对该研究目标,提出了一种基于混合决策深度强化学习的动态计算卸载及资源分配算法,该算法利用深度确定性策略梯度和决斗双深度Q网络来改进ActorCritic架构,采用集中训练分散执行的框架,实现MID之间协同计算卸载。此外通过调用DDPG的Actor部分来处理连续任务分割以及本地计算资源分配,将DDPG的Critic与D3QN相结合实现离散的MID与MEC或云服务器关联,以解决多MEC服务器多用户云边协作场景中混合决策问题。仿真结果表明,所提算法与DDPG-DQN等基线算法相比,具有更好的稳定性和更快的收敛性。同时在不同的任务到达率下,平均系统服务成本明显降低。此外还验证了在不同的系统参数下,云边协同处理比其他基准方案具有更佳的性能。
其他文献
新冠肺炎疫情的传播是当前人类社会面临的重要挑战,也是现代传染病研究的热点。使用传统传染病动力学模型和地理时空特征分析开展相关研究是当前针对新冠肺炎疫情的主要方法。传染病动力学模型的参数复杂多变并且难以获取合适的参数值,地理时空特征分析的方法并没有考虑人类移动性,而人类的活动与疫情的传播息息相关。本文提出基于人群迁徙网络社区的新冠疫情分析方法。首先,利用人群迁徙数据分别构建城市级别上的人群迁徙单一网
多智能体系统一致性因其在交通运输规划、机器人路径规划等领域的广泛应用,成为控制理论及应用领域学者关注的热点问题之一。目前关于多智能体系统渐近一致性、有限一致性和固定时间一致性的研究已取得非常丰硕的成果。本文在现有研究基础上,针对一阶多智能体系统的指定时间二分一致性开展了进一步的研究。开展的主要工作如下:(1)针对符号有向一阶线性多智能体系统,设计了两种基于不同事件触发机制的指定时间控制算法,以代数
非线性方程组系统来源于实际应用,如信息科学、工程技术、自动化和科学计算等。非线性方程组系统大都存在多个不同于全局极小点的局部极小点,但经典的求解线性规划问题的算法并不能成功地求解非线性方程组系统。虽然现阶段有不少关于求解非线性方程组系统全局极小点的研究,其中包括:填充函数法,遗传算法等,但这些方法或者难以实现,或者需要较强的约束条件才能得到全局极小点。为了克服这些困难,本文主要采用同伦方法求解非线
近年来,二维层状材料因其独特的电子性质和光学性质成为下一代纳米光电器件应用的热门材料。石墨烯由于零带隙的限制,依然在短期内无法实现大规模应用。与之不同,TMDCs包括半导体性质和金属性质的两类,具有带隙大、自旋谷极化和超导等特性,特别是单层MoS2,它是TMDCs的典型代表,最薄的直接带隙半导体。与传统的硅基半导体相比,单层MoS2薄膜被认为是下一代电子器件和集成电路的替代材料,同时也在能源催化、
近年来,随着遥感技术的发展,新型卫星传感器不断涌现。不同的遥感传感器获得的遥感图像,由于传感器之间的成像机理迥异,形成的遥感图像有着各自的优劣势。为了全面了解地物目标特征及其变化,多源卫星传感器数据融合应运而生,即将不同类型传感器获取的影像数据融合的技术。其生成的融合图像可以综合利用不同卫星传感器数据的优势,以应对越来越多有着更严苛要求的遥感应用。光学时空融合和合成孔径雷达(Synthetic A
<正>近日,淄博烧烤在网络走红,成为消费低迷时代的一个亮眼的网络现象。很多事情能成功,往往是天时、地利、人和的合力结果。就以天时来说,春光大好,报复性的旅游就出现了。很多城市受淄博烧烤走红的启发,也在准备出战,希望复制这种路径。比如现在很多网络信息都指向徐州,因为徐州的美食本来就很有地方特色,烧烤更有源远流长的历史。
面对与日俱增的高数据速率需求,第五代移动通信技术(5th Generation Mobile Communication Technology,5G)成为无线通信领域的前沿技术,以此作为驱动力的无线通信系统能满足人们超高信息传输速率和超大信息传输量的要求。大规模多路输入多路输出(massive Multiple-Input Multiple-Output,m MIMO)技术被引入为关键技术充分挖掘
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)技术在基站侧部署大量天线,能显著提高系统的吞吐量,可靠性和频谱效率,被视为5G通信研究中的热点之一。为了实现这些优势,需要获取精确的信道状态信息(Channel State Information,CSI)。然而,信道估计过程中导频开销限制了大规模MIMO系统的性能。基于此,本文研究了基于低秩矩阵完备和低秩
近年来,随着计算机软件技术的迅速发展以及硬件技术的不断提高,图像语义分割技术正在成为机器视觉领域一个十分重要的研究热点,在计算机视觉众多研究领域中发挥着十分重要的作用。图像语义分割本质上是图像像素分割与图像内容理解的结合,其目的是给每个图像像素赋予某个特定类别的语义标签。得益于硬件技术的不断发展、计算能力的不断提升、图像数据的海量井喷,基于深度学习的图像语义分割技术已经广泛应用于影视特效、无人驾驶