基于深度强化学习算法的空间站任务重规划方法

来源 :载人航天 | 被引量 : 0次 | 上传用户:zhangtianyu66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对空间站短期任务重规划问题规划周期短、实时性约束多、约束传播复杂的特点,结合深度强化学习在智能学习和决策上的优势,提出了适用于深度强化学习的空间站任务状态空间编码方式,实现了基于深度确定性策略梯度算法的空间站任务重规划方法。该方法可以通过学习,自主化解约束冲突,摆脱人为预先设定约束冲突化解策略的限制。仿真分析表明:该方法可以通过算法本身不断地学习进化,找到空间站任务重规划问题的近似最优解,相比于传统解决方法,具有很强的智能性和适应性,为解决空间站任务规划问题提供了新思路。
其他文献
在知识经济飞速发展、信息技术不断进步的时代背景下,“大众创业,万众创新”战略促进了我国社会创新发展的步伐,社会中的政府机关、中小企业的知识需求也越来越高,科技情报机
为辅助航天员克服服内气压的影响,更好地完成舱外任务,进行了登月助力航天服关节自由度分析,优化设计了二代登月助力航天服的机械结构;使用ANSYS Workbench软件对前后两代登
针对未来航天器拓展曲面散热面的需要,在国内首次设计并制作了一种将热总线翅片管路预埋在曲面蜂窝板内的可展开辐射器;搭建了常温常压试验台,通过试验过程热像图验证了预埋
在卫星系统的静态定位中,通常把几何精度因子GDOP的大小作为评价星座组合优劣的重要判据。主要对GDOP求解过程中可能出现的问题进行了讨论,并给出了相应的解决方案。
“下载高温消毒洗程序,洗衣机就能把水加热到60℃,洗30分钟就能有效杀灭新冠病毒……”2月3日上午10时,海尔智家洗衣机的售后服务工程师正通过直播的方式,十分“卖力”地向消
熏洗疗法在我国已有悠久历史,历代医家著作中都有相关记载,如《外科精义》一书中,专门有一章节论述熏洗疗法。在“湿渍证肿法”章节中说:“肿初生,经一二日不退,继续用水淋身之。其
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
Trans-Flo矩形周进周出沉淀池是一种先进的二沉池工艺,尤其适用于占地紧张及全地下污水处理厂的紧凑设计。文章对该技术的关键点即进出水系统和排泥系统设计进行了介绍。
美国的市场体系经过长期的发展 ,已经相当完善。美国实行的是以私有制为基础的自由企业制度。与其他发达资本主义国家相比 ,其经济自由的特点尤为突出 ,自由企业制度成为美国