基于深度强化学习的DAG任务智能调度算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:liuyi_wenzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布式异构计算系统中的DAG(Directed Acyclic Graph,有向无环图)任务调度是计算机体系结构研究领域中的热点问题之一,而调度模型与调度算法是DAG任务调度中最重要的两个方面。如何合理地将任务分配给不同处理器,从而得到最短的完成时间,是任务调度需要解决的问题。另外,新型应用的DAG任务具有计算任务种类多、并行依赖关系复杂等特点,传统启发式调度算法难以自适应软硬件系统的发展变化,通常导致系统运行效率的下降。利用机器学习的方法解决传统启发式方法遇到的难题是系统研究领域的发展方向。为解决异构计算系统中DAG任务自适应调度问题,本文拟结合深度学习与强化学习的方法,设计实现满足多种应用场景的自学习智能调度算法。本文的主要研究工作如下:(1)分布式异构计算系统中DAG任务智能调度模型的设计。在分布式异构计算系统中,DAG任务的智能调度模型主要涉及基于强化学习的DAG任务调度模型、调度目标、调度状态、调度动作以及调度奖励函数等要素的表示。(2)基于深度学习与强化学习相结合的调度算法。在本文中,我们提出了一种使用深度强化学习的自适应DAG任务调度(ADTS)算法。在强化学习过程中恰当地定义了调度问题。设计了高效的调度状态空间,动作空间与奖励函数来训练基于策略梯度的REINFORCE智能体。利用该算法探索长期奖励的能力,ADTS算法可以实现良好的调度策略。实验结果表明,本文提出的ADTS算法与经典的HEFT与CPOP算法相比具有一定的有效性。(3)基于蒙特卡洛树搜索的DAG任务智能调度算法。在本文中,我们提出了一种单智能体蒙特卡洛树搜索(MCTS)的DAG任务智能调度算法。利用MCTS方法来确定实际调度策略。在任务调度过程中,该算法平衡了探索与利用的关系。实验结果表明,本文提出的单智能体MCTS算法与经典的HEFT、CPOP与PEFT算法相比具有一定的有效性。
其他文献
计算机视觉几何领域有一类非常重要的问题是如何对受折射影响的场景进行三维重建。如今,受折射影响的视觉几何还有非常多的地方没有被探索,无论是受折射影响场景的稀疏重建,还是对场景的稠密化,均没有比较成熟的算法。经典的视觉几何的主要研究对象集中在单视点相机模型上,受折射影响的场景不适合应用单视点相机模型进行重建,所以有越来越多的研究去关注比单视点相机模型更广泛适用的非单视点相机模型。文章研究的是由已知的射
社会主义核心价值观是当代中国精神的集中体现,是凝聚社会共识的“最大公约数”。党的十八大以来,以习近平总书记为核心的党中央,以高远的历史站位、宽广的国际视野、深邃的战略眼光,将中国特色社会主义人才培养作为一项重大战略任务。这明确要求各级各类学校审慎思考“培养什么人、怎样培养人、为谁培养人”的根本问题。这项战略任务关乎到党的教育方针、学校的根本任务、教育教学改革等问题,由此,提出了“立德树人,培根铸魂
克氏原螯虾是我国重要的水产经济动物,目前面临的主要问题有:苗种繁育不足、养殖模式欠佳、单位面积产量低等。生物生理与行为的昼夜节律性是由其生物钟来调节的,它产生的内
随着研究生教育规模的不断扩大,研究生教育质量问题愈加得到社会各界的关注。2015年10月24日,国务院印发《统筹推进世界一流大学和一流学科建设总体方案》,要求按照“四个全面”战略布局和党中央、国务院决策部署,坚持以中国特色、世界一流为核心,以立德树人为根本,以支撑创新驱动发展战略、服务经济社会发展为导向,坚持“以一流为目标、以学科为基础、以绩效为杠杆、以改革为动力”的基本原则,加快建成一批世界一流
马克思分配正义理论是在批判和继承空想社会主义者和资产阶级古典政治经济学者的分配思想基础上形成的,是马克思主义理论的一个重要组成部分。马克思分配正义理论以分配从属于生产为逻辑起点,揭露了资本主义私有制的本质,批判了资本主义生产方式的非正义性,提出了按劳分配和按需分配原则,并指出实现人的自由而全面的发展是社会主义的最终目的。分配是关乎民生发展的基础性问题,关系到广大人民群众的切身利益和国家的稳定发展,
开发者在构建Web前端项目时不仅要考虑站点的内容和功能,还需要关注图形用户界面(graphical user interface,GUI)的设计与实现,而GUI是决定页面吸引力的重要因素。但GUI设计是一项需要良好的艺术品味和审美能力的工作,Web前端页面的开发人员往往不具备这样的能力,因此需要设计人员的介入,二者之间存在沟通和交流的巨大成本。但从另一方面看,互联网本身就是一个海量的作品集,包含大
板带材矫直机作为板带材轧制后的重要辅助设备之一,主要用于改善板带材的平直度,提高材料的力学性能,其矫直原理在于使材料连续反弯而发生弹塑性变形,使纤维层趋向等长进而被矫平。目前,矫直理论中关于压下量、弯曲曲率等工艺参数的计算与实际仍存在差距,其主要原因一方面在于大多矫直模型集中在假设及理想化矫直过程的研究中,定性分析偏多,定量分析偏少,另一方面是实际生产中存在的很多矫直问题一直没有得到关注,例如轧件
来泽证券公司江苏分公司所处的证券行业具有周期性强、不确定高的特点,受到国内外经济环境、资本市场表现和监管环境等多方面因素影响。代买业务、投资收入和投行收入一直是行业的主要收入来源,但代买业务随着持续竞争和佣金费率的下滑贡献度持续下滑,投资收入与市场表现密切相关、贡献度波动较大,投行业务深受政策影响。自2012年创新大会以来,证券行业迎来了飞速的创新和发展,资产规模与业务规模快速增加,融资融券和股票
信息技术的进步促使各个领域都出现了海量高维数据。高维数据包含大量冗余特征与噪声,严重影响了学习任务的效率,降低了算法模型的准确率,因此如何采用降维方法来有效降低数据维数已成为研究热点。特征选择作为一种有效的维数约简方法,因保留了原始特征空间的语义信息而得到了广泛的研究与关注。现阶段特征选择方法已取得良好成效,但仍存在一些不足之处,比如流形结构信息保留不充分、流形结构保留策略对干扰不够鲁棒以及稀疏正
无人驾驶飞行器Unmanned aerial vehicles(UAVs)被越来越广泛的运用在军事和民用环境中执行关键任务,因为它们可以在危险条件或极端天气下执行任务。运动的飞行器和车辆等都