论文部分内容阅读
虚拟装配是虚拟制造的重要组成部分,利用虚拟装配,可以验证装配设计和操作的正确与否,以便及早的发现装配中的问题,对模型进行修改,并通过可视化显示装配过程。路径规划是虚拟装配的一个重要发展方向,研究虚拟装配环境下的路径规划技术对于复杂环境的装配路径设计具有十分重要的意义。装配路径规划是从产品的装配起点出发,根据装配环境的特点及待装配零部件与其它零部件的相对位置关系等信息进行路径求解,并最终获得一条满足装配要求的无碰撞路径。在计算机上搭建虚拟装配场景,实现装配路径的规划,可及时验证装配产品零部件的装配有效性。但是路径规划主要用于机器人领域,通过传感器识别简单环境,根据环境建模对路径进行规划。而虚拟装配中具有大量复杂环境,不容易被建模且包含狭窄空间,传统路径规划算法无法保证复杂环境下的通行性和规划效率,因而不适宜直接运用在虚拟装配的复杂环境中。针对虚拟装配中自由空间相对狭窄而造成的复杂环境通行性问题,提出了通过跟踪和反馈的方式学习最优的动作序列决策的深度强化学习。本文基于深度强化学习实现了虚拟装配的路径规划,主要完成了以下几个方面的问题:(1)介绍了路径规划领域的发展和研究现状,通过分析国内外的研究成果和实际问题,归纳出本文所解决的问题:虚拟装配中因自由空间相对狭窄而造成的复杂环境通行性问题。(2)详细介绍了深度学习和强化学习的基础理论,在分析深度学习和强化学习的算法原理和适用性的基础上,本文提出利用深度强化学习来解决虚拟装配的路径规划问题,该方法将深度学习的感知能力和强化学习的决策能力相结合,适用于解决序列决策问题。(3)将虚拟装配的路径规划问题转换为寻路的序列决策问题。从理论上验证,本课题提出的深度强化学习能够训练深度网络来解决自动寻路问题。(4)本文为了验证模糊贝叶斯-深度Q网络算法在虚拟装配环境中的实验效果,对虚拟装配的复杂环境进行了模拟,在模拟环境中对算法进行了研究确保该方法的可行性和有效性。对虚拟装配中具有狭窄空间的复杂环境具有较好的通行性和规划效率。