【摘 要】
:
针对动态在线任务分配策略难以有效利用历史数据进行学习、同时未考虑当前决策对未来收益的影响的问题,提出基于深度强化学习的空间众包任务分配策略.首先,以最大化长期累积
【机 构】
:
合肥工业大学管理学院,合肥工业大学过程优化与智能决策教育部重点实验室
【基金项目】
:
国家自然科学基金项目(No.91546108,71901001,71521001),安徽省科技重大专项项目(No.201903a05020020),安徽省自然科学基金项目(No.1908085QG298)资助
论文部分内容阅读
针对动态在线任务分配策略难以有效利用历史数据进行学习、同时未考虑当前决策对未来收益的影响的问题,提出基于深度强化学习的空间众包任务分配策略.首先,以最大化长期累积收益为优化目标,基于马尔科夫决策过程从单个众包工作者的角度建模,将任务分配问题转化为对状态动作价值Q的求解及工作者与任务的一对一分配.然后采用改进的深度强化学习算法对历史任务数据进行离线学习,构建关于Q值的预测模型.最后,动态在线分配过程中实时预测Q值,作为KM(Kuhn-Munkres)算法的边权,实现全局累积收益的最优分配.在出租车真实出行数
其他文献
摘要:在当下注重核心素养的课程改革新时期,海派学校体育文化要从理论走向实践,体育教师需要基于“海派学校体育文化”的新理解,探索建构“新”教学。本文从如何实施指向学科核心素养的单元学习设计、开展真实情境的深度学习和倡导技术与教学的深度融合三个方面具体予以描述,并辅以实践探索中的案例,为新时期海派学校体育文化“何为”提供先行先试的经验。 关键词:海派文化;学校体育文化;理解;行动 中图分类号:G6
手性催化被认为是合成手性化合物最有效的途径,近几十年来一直受到人们的广泛关注。本文介绍了手性催化剂在不对称合成中的重要作用,并详细介绍了近年来生物催化剂、手性金属
信息时代的到来,推动了各行各业的改革和创新,主要的创新路径是在信息技术以及新媒体时代相关发展规律的基础上进行优化。本文便是在新时代图书出版领域,通过对图书出版编辑
公务航空尽管受航线审批、时刻资源、地面服务、行业规范等因素制约,但社会对公务机“奢侈”形象的负面认知,使其发展受到极大影响。本文分析了公务航空被误认为奢侈品的原因,分
进入新时代,专业出版行业迎来重大战略机遇期,从高速发展向高质量发展转型。"十三五"以来,专业出版项目数量和经费大量增加,质量要求也逐步提高,对出版人员的素质提出了更高
在难降解有机废水厌氧处理过程中,水解酸化工艺能有效提高废水可生化性,减少处理流程,降低运行成本,有效抑制有毒有害物质对微生物活性影响。阐述了温度、pH、水力停留时间、
摘要:本文结合科研院所学术期刊现状及青年编辑的职业状态,从职业定位和成长策略两方面为青年编辑提出建议。青年编辑应结合自身编辑实践不断培养学术能力,充分利用科研院所有利条件,充实专业知识,做“学者型编辑”。 关键词:职业定位;科研院所;青年编辑;学术期刊 中图分类号:G238 文献标志码:A 文章编号:1674-8883(2021)05-0214-02 我国由科研院所、高等院校和学术团体主办的
碳点是一类粒径小于10 nm且具有荧光特性的新型碳纳米材料。与传统半导体量子点相比,因其具有良好的水溶性、光稳定性、生物相容性、低毒性以及易于实现表面功能化、原材料丰
利用东海盆地长江坳陷古新统美人峰组烃源岩的元素、热解、干酪根δ13C、镜质体反射率、岩石薄片、X射线衍射等资料,对长江坳陷美人峰组不同层段烃源岩进行沉积环境分析及生
针对当前多智能体强化学习算法难以适应智能体规模动态变化的问题,文中提出序列多智能体强化学习算法(SMARL).将智能体的控制网络划分为动作网络和目标网络,以深度确定性策略