【摘 要】
:
针对蒸汽发生器精确建模困难和低工况下控制性能差的问题,本文提出了一种基于深度强化学习优化的智能分层(IH)控制器.使用串级PI控制器作为初级控制器,用于直接控制水位.高级控制器采用经过深度强化学习优化的智能体控制器,负责实时对串级PI的参数进行优化,以便获得更好的控制性能.在高级控制器智能体的训练过程中,通过构建状态信息和奖励函数并采用深度残差神经网络逼近作为Q函数和策略函数的逼近器,获得了较好的泛化性能.结果表明:在不同的功率水平下,智能分层方法不仅对蒸汽发生器水位控制具有良好的跟踪能力,而且还具有很好
【机 构】
:
哈尔滨工程大学 核安全与先进核能技术工信部重点实验室,黑龙江 哈尔滨150001;哈尔滨工程大学 核安全与仿真技术国防重点学科实验室,黑龙江 哈尔滨150001
论文部分内容阅读
针对蒸汽发生器精确建模困难和低工况下控制性能差的问题,本文提出了一种基于深度强化学习优化的智能分层(IH)控制器.使用串级PI控制器作为初级控制器,用于直接控制水位.高级控制器采用经过深度强化学习优化的智能体控制器,负责实时对串级PI的参数进行优化,以便获得更好的控制性能.在高级控制器智能体的训练过程中,通过构建状态信息和奖励函数并采用深度残差神经网络逼近作为Q函数和策略函数的逼近器,获得了较好的泛化性能.结果表明:在不同的功率水平下,智能分层方法不仅对蒸汽发生器水位控制具有良好的跟踪能力,而且还具有很好的抗干扰能力.通过仿真验证了控制器的有效性.
其他文献
为了加深对压气机静叶吸力面的流动分离研究与理解,本文使用URANS模型瞬态模拟扰流棒产生的周期性低频尾迹来流与平板表面的流动分离转捩之间的交互作用.在平板前缘约3%自由流湍流度,进口雷诺数70000的条件下,通过计算折合频率f+=0.5对应的平板表面流动状态,揭示了低频来流尾迹与分离剪切层内部运动之间的交互作用.结果表明:来流尾迹导致边界层分离点略微提前,同时由于周期性的移动而没有确定的再附着点.尾迹能量输入导致分离泡被压缩拉长是分离泡抑制的具体过程,大约持续0.125个扰流棒周期.分离转捩区内高能震荡区
针对水下无人航行器与运动母船对接过程中存在多种复杂约束,单一优化目标无法满足多目标同时最优的问题,本文通过将满意控制思想引入到模型预测控制中,设计了一种约束条件下的多目标多自由度的满意模型预测控制对接控制器.首先,对动基座水下无人航行器对接过程中的多种复杂条件进行详细分析.然后,将水下无人航行器模型按照满意思想进行分布式处理,得到北东位置、深度、纵倾和航向模型.最后,将多种复杂约束分别引入到分布式的水下无人航行器预测模型和目标函数中,进行优化求解.仿真结果表明:该方法在处理多种复杂约束问题上的快速性和稳定
为解决多参数、多约束条件的潮流能涡轮机阵列优化问题,提出了一种改进的离散量子粒子群(quantum dis-crete particle swarm,QDPS)算法.该算法将计算区域离散化,每个粒子代表一种涡轮机阵列布局,并以发电量为目标函数,利用更新公式进行迭代优化.基于舟山普陀山岛—葫芦岛水道涨急和落急时刻的流场数据进行算法验证,分析了涡轮机阵列优化效果.结果表明:离散量子粒子群算法能够实现自主智能优化,优化速度快,与传统交错布局相比,涨急时刻涡轮机阵列总发电量提高了28.9%,落急时刻涡轮机阵列总发
针对阴影屏蔽体的材料选取与仪器仓布局问题,本文以核动力航天器为对象,研究了屏蔽材料与结构材料的辐射特性,计算得到了屏蔽体阴影区域内的辐射场分布.本文利用蒙特卡罗方法在屏蔽阴影区范围内对中子与光子进行输运计算,得到中子与光子在空间中的分布情况.通过得到的不同屏蔽材料与结构材料对具有特定能谱的中子与光子的屏蔽效果,选出了适用于空间反应堆屏蔽体设计的材料,确定了一种满足辐射防护限制要求的屏蔽材料组合方式.研究表明:铅、氢化锆和聚乙烯应用于空间堆的辐射屏蔽能使屏蔽体更加轻质化,掺杂氢化锆粉末的聚乙烯复合型材料的屏
艇体形状同时影响水下航行器的快速性和隐身性两大重要性能.为了探究艇体形状对阻力以及流噪声的综合影响规律,本文应用Myring方程确定了不同头部形状、艉部形状,以及平行中体长度的艇型,基于CFD方法应用Realizable k-ε湍流模型对不同艇型的阻力进行计算,并应用大涡模拟湍流模型结合FW-H方程对不同艇型的流噪声进行了计算.结果显示在流速、艇体长度、长宽比等条件相同时,头部形状中等饱满,艉部外凸,平行中体长度小的艇体阻力以及流噪声小.计算结果可对水下航行器的形状设计提供一定参考.
为研究影响内燃机可燃混合气分布的柴油雾化特性,本文基于平面激光测径技术开展柴油喷雾粒径分布的试验研究,对图像信号强度和喷雾粒径之间进行标定,获取不同喷油压力、背景压力和喷孔孔径条件下的可视化图像,探究其对喷雾粒径分布的影响.结果表明:喷雾粒径分布与喷雾浓度场结构分布吻合,靠近喷嘴的液核区喷雾SMD最大,沿着喷雾轴线SMD在逐渐减小,喷雾外围部分SMD最小.提高喷油压力对于D0.1的降幅最大,表明喷雾前锋面粒径受喷油压力的影响最大;喷雾SMD随着背压的增大而增大,D0.9的涨幅最大,表明增大背景压力会使喷雾
为给船用柴油机电控系统软件提供受控对象,本文以船用柴油机高压共轨燃油系统作为仿真对象,建立高压共轨燃油系统的性能仿真模型,计算得到共轨各部件的特性数据,再利用性能仿真计算数据和计算公式建立实时仿真模型,实时仿真模型包括高压油泵子模型、共轨管子模型、喷油器子模型和质量转换子模型等.实时仿真模型可根据电控系统发出的燃油喷射控制和轨压调节信号,实时计算高压共轨燃油系统的压力波动、喷油量和喷油率等特性参数.对开发的高压共轨燃油系统实时仿真模型进行了稳态工况下的喷油量精度对比,以及闭环控制下共轨压力波动的试验,其误
为了保证从核电站大量数据中有效地挖掘信息以及故障下运行状态的智能表征,本文提出一种基于粒子群优化和最小二乘支持向量机的系统级故障程度评估方法,用于完善故障诊断系统的功能.针对最小二乘支持向量机算法的超参数选取对于回归精度影响较大问题,应用基于粒子群优化算法借助智能搜索策略来优化模型的超参数.基于最优超参数的回归模型能够提取系统级参数间的约束关系,以进行实时故障程度的评估.性能测试表明:采用提出的方法能够有效评估核电站系统级故障的程度,相较于粒子群优化-支持向量机以及最小二乘支持向量机算法具有更高的回归精度
为了优化单信标导航算法中导航点的选取以提高导航精度,本文分析并比较了不同水下单信标导航算法的置信区间.考虑了3种典型的水下单信标导航算法:基于时延信息的单信标导航算法、基于方位角信息的单信标导航算法以及联合使用时延和方位角信息的单信标导航算法.本文首先基于偏微分矩阵建立了3种方法的导航误差和各测量误差的关系式,在此基础上利用导航误差的协方差矩阵分析了时延测量误差和方位角测量误差对3种方法导航结果置信区间分布的影响.此外,本文从水平位置精度因子和置信椭圆这2个角度对3种方法导航结果的置信区间的分布进行了比较