【摘 要】
:
基于深度强化学习策略,研究了一类变体飞行器外形自主优化问题。以一种抽象化的变体飞行器为对象,给出其外形变化公式与最优外形函数等。结合深度学习与确定性策略梯度强化学习
【机 构】
:
北京航空航天大学自动化科学与电气工程学院
【基金项目】
:
国家自然科学基金(61305132,61563041);航空科学基金(20135751040)
论文部分内容阅读
基于深度强化学习策略,研究了一类变体飞行器外形自主优化问题。以一种抽象化的变体飞行器为对象,给出其外形变化公式与最优外形函数等。结合深度学习与确定性策略梯度强化学习,设计深度确定性策略梯度(DDPG)学习步骤,使飞行器经过训练学习后具有较高的自主性和环境适应性,提高其在战场上的生存、应变和攻击能力。仿真结果表明,训练过程收敛较快,训练好的深度网络参数可以使飞行器在整个飞行任务过程中达到最优气动外形。
其他文献
五年制高职是在初中教育的基础上进行的职业技术教育,因此他们有着与高中后完全不同的学习习惯和行为习惯,本文对五年制高职学生的行为习惯进行调查分析,并提出了引导五年制
财产性收入是指通过资本、技术和管理等要素在社会生产和生活中所产生的收入,它是城乡居民家庭总收入构成的一个组成部分。中国居民家庭财产性收入增长呈现财产性改入比重偏
开展药品集中采购是在助力“健康中国”目标的实现,药品集中采购也是深化医改、解决“看病贵”的重大举措之一,让药品价格回归合理水平,让人民群众以比较低廉的价格用上质量
目的:探讨Pilon骨折术后中医分期辨证治疗对骨折愈合及相关并发症的影响。方法:将2017年1月-2018年3月Pilon骨折患者90例作研究对象进行分组。对照组施行术后常规治疗,观察组
潜水是个特殊的职业工种,它要求从事潜水的救捞人具有“特别能吃苦、特别能战斗、特别能团结、特别能奉献”的职业道德;救捞人在实践中表现出来的这些精神和作风,激励和鼓舞
近年来,尤其是在备战2012年伦敦奥运周期,以核心力量为代表的一些新的力量训练方法和手段开始在世界范围内兴起。与传统的抗阻力量训练相比,新的力量训练方法更加突出神经对肌肉
随着信息技术的普及使得信息的接受、处理和反馈的速度越来越快,现代企业的财务管理状况正处在不断变化中,因而,有必要加强财务管理以应对这些变化,而财务管理理念是企业财务
6月6日,首届中美儿童阅读高级研讨会在京召开,会议邀请了美国阅读教育研究交流团、国内出版业人士、阅读推广人以及政府部门和民间组织的代表分享儿童阅读理论和实践经验。中
目的1.探讨卯时神阙穴敷贴防治混合痔术后便秘的护理效果。2.为临床有效防治混合痔术后便秘提供依据和指导。方法采用便利抽样法,研究对象选取2018年4月-2019年3月在哈尔滨市某三甲医院肛肠科住院部行混合痔外剥内扎术术后患者110例,随机分为对照组、观察组各55例。对照组给予常规治疗和护理,观察组在此基础上,于术后第1日卯时(5:00-7:00)给予神阙穴穴位敷贴,保留2小时,每日1次,干预14天
拖滞力矩作为汽车制动钳的一项重要检测指标,其值过大会增加汽车油耗、损坏零件,容易造成抱死。目前企业实验室检测拖滞力矩采用人工注油的液检方式,自动化程度低,且检测时不