强化学习在运筹学的应用:研究进展与展望

来源 :运筹与管理 | 被引量 : 0次 | 上传用户:iloveyouguoran
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习已经成为人工智能领域一个新的研究热点,并已成功应用于各领域,强化学习将运筹优化领域的很多问题视为序贯决策问题,建模为马尔可夫决策过程并进行求解,在求解复杂、动态、随机运筹优化问题具有较大的优势。本文主要对强化学习在运筹优化领域的应用进行综述,首先介绍了强化学习的基本原理及其应用于运筹优化领域的研究框架,然后回顾并总结了强化学习在库存控制、路径优化、装箱配载和车间作业调度等方面的研究成果,并将最新的深度强化学习以及传统方法在运筹学领域的应用研究进行了对比分析,以突出深度强化学习的优越性。最后提出几个
其他文献
目的:探讨外伤性脾破裂的急救及护理。方法:回顾总结3年共35例外伤性脾破裂的临床治疗和护理资料,分析了主要救护措施,以及疗效与护理的密切关系。结果:本组临床疗效满意3,5例全
会计信息连接投资者、债权人、政府和社会公众,而会计信息的提供者为企业的会计部门。会计信息失真的成因很多,本文就会计信息失真与企业内部会计控制的关系作一些粗略的分析
在震后救援初期,构建合理的应急物流网络,对于快速有效供应应急物资、减轻灾情具有重大价值。在传统可靠性选址问题与应急设施选址-分配问题的基础上,考虑震后救援初期的阶段
本文以洪涝自然灾害为现实背景,考虑多种应急物资、灾情的不确定性和应急救灾的多目标性,集成优化灾前准备和灾后响应两阶段,建立了一定最大救援时间下的两阶段多目标混合整
测力仪的弹性体结构为应变式测力仪的基体结构,影响整个测力仪的测量精度.为了对高速微切削测力仪弹性体结构优化,采用多目标拓扑优化方法,在保证刚度和特定体积分数情况下,
本文讨论了硫酸盐渍土盐胀率随含水量、硫酸钠含量、初始干容重、温度和Cl-/SO42-五因素变化的规律.指出了含盐量、含水量、初始密度对盐胀影响程度不同且具有交互作用.通过
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
针对多产品联合库存决策问题,在市场需求不确定条件下,建立了考虑联合订货成本的多产品库存鲁棒优化模型。针对不确定市场需求,采用一系列未知概率的离散情景进行描述,给出了
文章以"安全"为导向,以社区重建及其环境安全为切入点,以汶川地震灾区具有代表性的都江堰、北川、映秀3个城镇的4个不同类型社区为主样本,进行了以量化研究为主的实证评价研
目的:总结影响系统性红斑狼疮(SLE)患者睡眠状况护理办法.方法:根据SLE的临床特点,对40例SLE患者进行睡眠质量进行评估,予针对性的护理.结果:40例在住院期间睡眠质量有提高.结论:对