基于深度强化学习的空间众包任务分配策略

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户：nanlulgd

【摘要】

：

针对动态在线任务分配策略难以有效利用历史数据进行学习、同时未考虑当前决策对未来收益的影响的问题,提出基于深度强化学习的空间众包任务分配策略.首先,以最大化长期累积

【作者】

：

倪志伟刘浩朱旭辉赵杨冉家敏

【机构】

：

合肥工业大学管理学院,合肥工业大学过程优化与智能决策教育部重点实验室

【出处】

：

模式识别与人工智能

【发表日期】

：

2021年3期

【关键词】

：

空间众包任务分配多阶段序贯决策深度强化学习 Spatial Crowdsourcing Task Allocation Multi-stage S

【基金项目】

：

国家自然科学基金项目(No.91546108,71901001,71521001),安徽省科技重大专项项目(No.201903a05020020),安徽省自然科学基金项目(No.1908085QG298)资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对动态在线任务分配策略难以有效利用历史数据进行学习、同时未考虑当前决策对未来收益的影响的问题,提出基于深度强化学习的空间众包任务分配策略.首先,以最大化长期累积收益为优化目标,基于马尔科夫决策过程从单个众包工作者的角度建模,将任务分配问题转化为对状态动作价值Q的求解及工作者与任务的一对一分配.然后采用改进的深度强化学习算法对历史任务数据进行离线学习,构建关于Q值的预测模型.最后,动态在线分配过程中实时预测Q值,作为KM(Kuhn-Munkres)算法的边权,实现全局累积收益的最优分配.在出租车真实出行数

其他文献

海派学校体育文化：从理解到行动

摘要：在当下注重核心素养的课程改革新时期，海派学校体育文化要从理论走向实践，体育教师需要基于“海派学校体育文化”的新理解，探索建构“新”教学。本文从如何实施指向学科核心素养的单元学习设计、开展真实情境的深度学习和倡导技术与教学的深度融合三个方面具体予以描述，并辅以实践探索中的案例，为新时期海派学校体育文化“何为”提供先行先试的经验。　　关键词：海派文化;学校体育文化;理解;行动　　中图分类号：G6

期刊

海派文化学校体育文化理解行动

手性催化剂研究进展及其在不对称合成中的应用

手性催化被认为是合成手性化合物最有效的途径,近几十年来一直受到人们的广泛关注。本文介绍了手性催化剂在不对称合成中的重要作用,并详细介绍了近年来生物催化剂、手性金属

期刊

手性催化剂生物催化剂手性金属络合物催化剂手性有机小分子催化剂不对称合成 chiral catalystbiocatalystchiral

媒体融合背景下图书编辑素养的提升策略

信息时代的到来,推动了各行各业的改革和创新,主要的创新路径是在信息技术以及新媒体时代相关发展规律的基础上进行优化。本文便是在新时代图书出版领域,通过对图书出版编辑

期刊

媒体融合图书编辑素养提升优化策略

公务航空莫让奢侈外相抹煞其交通属性

公务航空尽管受航线审批、时刻资源、地面服务、行业规范等因素制约，但社会对公务机“奢侈”形象的负面认知，使其发展受到极大影响。本文分析了公务航空被误认为奢侈品的原因，分

期刊

航空运输通用航空公务机

青年编辑能力培养浅谈

进入新时代,专业出版行业迎来重大战略机遇期,从高速发展向高质量发展转型。"十三五"以来,专业出版项目数量和经费大量增加,质量要求也逐步提高,对出版人员的素质提出了更高

期刊

青年编辑能力培养出版人才

水解酸化工艺应用于难降解有机废水综述

在难降解有机废水厌氧处理过程中,水解酸化工艺能有效提高废水可生化性,减少处理流程,降低运行成本,有效抑制有毒有害物质对微生物活性影响。阐述了温度、pH、水力停留时间、

期刊

水解酸化难降解有机废水应用 hydrolysis acidificationrefractory organic wastewaterapplic

科研院所青年编辑的职业定位与成长策略

摘要：本文结合科研院所学术期刊现状及青年编辑的职业状态，从职业定位和成长策略两方面为青年编辑提出建议。青年编辑应结合自身编辑实践不断培养学术能力，充分利用科研院所有利条件，充实专业知识，做“学者型编辑”。　　关键词：职业定位；科研院所；青年编辑；学术期刊　　中图分类号：G238 文献标志码：A 文章编号：1674-8883（2021）05-0214-02　　我国由科研院所、高等院校和学术团体主办的

期刊

职业定位科研院所青年编辑学术期刊

碳点在生物成像中的应用进展

碳点是一类粒径小于10 nm且具有荧光特性的新型碳纳米材料。与传统半导体量子点相比,因其具有良好的水溶性、光稳定性、生物相容性、低毒性以及易于实现表面功能化、原材料丰

期刊

碳点生物成像应用进展 carbon dotsbioimagingapplicationreview

东海盆地长江坳陷美人峰组烃源岩沉积环境与生烃潜力评价

利用东海盆地长江坳陷古新统美人峰组烃源岩的元素、热解、干酪根δ13C、镜质体反射率、岩石薄片、X射线衍射等资料,对长江坳陷美人峰组不同层段烃源岩进行沉积环境分析及生

期刊

烃源岩沉积环境生烃潜力美人峰组长江坳陷 source rocksedimentary environmenthydrocarbon gen

序列多智能体强化学习算法

针对当前多智能体强化学习算法难以适应智能体规模动态变化的问题,文中提出序列多智能体强化学习算法(SMARL).将智能体的控制网络划分为动作网络和目标网络,以深度确定性策略

期刊

多智能体强化学习深度确定性策略梯度(DDPG) 序列到序列(Seq2Seq) 分块结构 Multi-agent Reinforcement Learn

基于深度强化学习的空间众包任务分配策略

其他学术论文