面向多机动态调度问题的两层Q学习算法

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:bgydong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于单机动态调度问题十分有效的Q学习,在多机动态调度环境下却由于缺乏全局眼光而效果欠佳,因此提出了一种双层Q学习算法.底层Q学习着眼于局部,以最小化设备空闲和作业平均流经时间为目标,学习单机调度策略;而顶层Q学习则着眼于全局,以平衡机器负载、最小化整体拖期值为目标,学习如何分配作业到合适机器.文中分别给出了两层Q学习的动作集、状态空间划分方式和奖惩函数设计,并通过对多机动态调度问题的仿真实验表明,提出的双层Q学习能够很好地解决改善动态环境下多机调度问题.
其他文献
前面我们分析了今天的家具业,要做大比较困难,因为:工人难请,尤其是技工;获利薄,难有资金积累来做大。因此企业做不了大。要生存,还得追求差异化,并且提高生产力。
针对大滞后系统,提出一种基于微粒群算法的灰色预测PID控制算法.采用灰色预测模型GMC(1,2)预测时滞系统的输出并用微粒群算法优化PID控制器的参数.这种控制方法不需要精确的数学模
就立法原意而言,官员道歉的制度化是对官员道歉行为的规范约束,还是鼓励这种形式的权力反省?进而言之,官员道歉制度化以后,道歉行为将会越来越多,还是变得越来越少?
针对目前运动目标的跟踪与记录方法占用存储空间较大的缺点,提出了一种减少存储空间的记录算法,即先用三帧差分算法和Snake算法相结合检出运动物体的轮廓,再利用Hausdorff算法对提出的轮廓进行匹配,并将匹配后的轮廓和运动轨迹以文本文件存储,大大降低了运动目标轨迹记录存储容量.实际运用表明,改进后的记录存储空间相当于通常视频文件的万分之一.该算法适于长时间记录运动目标轨迹.
在当今信息经济时代,无论是材料、能源、生物等新兴产业,还是机械、汽车、家电、家具等传统产业,都面临着用新的信息技术使产业发生改变的挑战.工业化与信息化融合已成为科技进步
新时期对艺术职业教育又赋予了新的使命。如何构建艺术职业教育的办学特色,把学生培养成创新型人才这个问题,就摆在了我们面前。本文从实际出发,从多方面、多角度论证了构建
纵观2013年,家居行业总体处于深化调整期:企业转型明显加速,新品开发周期加快,不良企业淘汰出局,老牌企业面临变革创新,二三线城市和新兴市场在销售上远好于一线城市。从整体来看,20
在评价结构物安全性中,非破坏检查技术成为必备的技术.检测结构物内部缺陷的方法有放射线透视法及超声波探伤法,从以往经验来看,大多数情形下采用放射线透视检查.不过,随着近
2月10日,据获悉,红星美凯龙已确认全资收购行业排名第三的吉盛伟邦,双方现已签署框架协议,近期将完成全部收购事宜。在未来数月,中国家居业将发生最大的一起并购案,这开启了行业整
在忻州市粮食种植结构中,除玉米外,小杂粮占有绝对的比重。中国号称“世界小杂粮王国”,山西小杂粮产量占全国10%以上,而忻州又是山西小杂粮的主产区。在山西三大小杂粮主产区晋北