改进Q学习算法在作业车间调度问题中的应用

来源 :系统仿真学报 | 被引量 : 0次 | 上传用户:LKYWGF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决动态环境下作业车间调度问题,提出了一种基于改进Q学习算法和调度规则的动态调度算法。以“剩余任务紧迫程度”的概念来描述动态调度算法的状态空间;设计了以“松弛越高,惩罚越高”为宗旨的回报函数;通过引入以“Softmax”函数为主体的动作选择策略来改进传统的Q学习算法,使改进后的Q学习算法在前期选择不同动作的概率更加平等,同时改善了贪婪策略在学习后期还会选择次优动作的现象。从6个不同算例中得到的仿真结果表明,该调度算法相较于改进前,性能指标平均提升约6.5%;相较于IPSO算法和PSO算法,性能指
其他文献
针对稀疏步进调频信号对目标径向运动敏感且低信噪比(SNR)下难以聚焦成像的问题,该文提出基于遗传算法和稀疏贝叶斯学习的平动补偿与高分辨逆合成孔径雷达(ISAR)成像方法。首先,针对稀疏步进调频信号建立回波模型和稀疏观测模型,通过构造参数化字典,将ISAR成像问题转换为目标运动参数估计与高分辨距离像(HRRP)合成的联合问题。然后,对目标高分辨距离像引入Gamma-Gaussian先验,并采用变分推
期刊
Burgers方程为Navier-Stokes方程组的简化形式,在计算数学和计算流体力学领域中有着广泛应用.本文设计了粘性Burgers方程的高阶精度半隐式加权紧致非线性格式(WCNS),并给出了稳定性分析.方程对流项和粘性项分别采用五阶精度WCNS格式和四阶中心差分格式计算.半离散系统采用三阶精度IMEX Runge-Kutta方法计算,非刚性对流项和刚性粘性项分别进行显式和隐式处理.数值结果表
期刊
信息素以及信息素策略是蚁群算法具有良好学习性的关键结构,斑迹蚁群算法将信息素释放在蚂蚁经过的节点上而不是子路径上,具有空间复杂度小和效率高的优点,在应用到机器人路径规划问题中时,提出了先验优势方位角的概念,建立了主优势网格和次优网格的模型,构建了起始点与目标点互换的交替双向引导策略,在求解具有复杂障碍物分布的大规模地图时,实现了一种汇聚融合的信息素结构。实验表明,大大提升了构建初始解及收敛的速度,
期刊
针对全直线上的KdV方程构造了时空全离散Legendre-Hermite谱配置格式,也就是在时间方向上用Legendre-Gauss-Lobatto节点为配置点,在空间方向上用Hermite-Gauss节点作为配置点,构造得到一个非线性矩阵方程,将其化为非线性方程组,利用通常的不动点迭代求解,数值实验表明这种方法的有效性.
期刊
中巴经济走廊是“一带一路”倡议的重要组成部分,深入认识该地区气候变化时空分布特征和规律,对于项目顺利实施和安全保障有重大意义。本文采用CRU TSv4.04逐月地面气候要素数据集,分析1980—2019年中巴经济走廊地区气温、降水、干湿状况的气候变化时空分布特征。结果表明:中巴经济走廊地区气温呈显著上升趋势,中部地区增温速率低于两端地区,最低温度增温速率最快,为0.39 ℃·(10a)~(-1);
期刊
为解决快速傅里叶变换(FFT)栅栏效应对水声正交频分复用(OFDM)通信系统解调性能的限制问题,提出基于选带傅里叶变换(ZoomFFT)的水声OFDM通信解调算法。将接收信号经过移频、降采样等处理得到其细化谱,提高频谱分辨力,削弱栅栏效应;同时对信道响应进行细化处理,基于最小均方误差(MMSE)原理构造信道均衡算法,消除信道影响,仿真结果表明,基于ZoomFFT的水声OFDM解调算法的性能优于传统
期刊
探究城市生态环境与人类活动的关系,是目前城市化进程中重要的研究内容。结合多源数据,提出采用POI(Point of Interest)点、OSM(Open Street Map)道路网、住宅区数据构建人类活动指标(住宅区可步行测度指数、街道活力指数、城市功能混合度指数)和利用遥感影像构建城市生态环境指标(遥感生态指数)的方法。并结合多项式回归(Polynomial Regression,PLR)、
期刊
在重庆境内,遂宁组(J_(3)s)钙质泥岩发育水耕人为土的剖面分异多不明显,而石灰岩发育水耕人为土则不尽如此,其原因尚不明确。为此,以上述两类母岩在不同坡位发育的水耕人为土为研究对象,分析水耕条件下钙质泥岩和石灰岩发育土壤的发生特征及系统分类归属,并以有机碳矿化特性为切入点,探讨其成因。结果表明,从中坡至坡麓,钙质泥岩发育的水耕人为土(CS)结构面上均仅有少量锈斑且游离铁的垂直分异不明显,而石灰岩
期刊
本文基于均值的增广拉格朗日乘子算法,提出了一种快速且具有较高精度的Toeplitz矩阵填充算法.新算法一方面通过均值结构化处理保证迭代后产生的填充矩阵是可行的Toeplitz矩阵,另一方面通过在迭代过程中嵌入修正步而极大地节约了计算时间,得到了更精确的填充矩阵.同时讨论了新算法的收敛性,最后通过数值实验表明新算法比基于均值的增广Lagrange乘子算法(MALM)和增广Lagrange乘子算法(A
期刊
分位数回归是对数据进行分析与预测的有效方法.由于分位数回归的损失函数具有非光滑性,有关分位数回归的计算问题仍面临着一些挑战.本文通过从罚分位数回归的对偶问题出发基于交替方向乘子法(Alternating Direction Method of Multipliers,简称ADMM)求解罚分位数回归问题.并在一些温和的条件下,给出对偶交替方向乘子法(dual ADMM,简称dADMM)的全局收敛性及
期刊