基于TD3算法的对话策略研究

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:dage10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对话策略是任务型对话系统构建的核心组件,通常被定义为强化学习,通过代理和环境的交互,提升对话策略效率.针对当前任务型的对话系统缺少高质量的标注数据集及模型难于收敛等问题,提出了结合规划的双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient)算法,用以优化对话策略.该算法使用孪生网络结构,采用软更新、策略噪音和延迟学习等方法,有效的改善了过估计问题.实验结果表明,该方法加速了模型的收敛,提升了对话成功率.
其他文献
针对源荷预测误差对主动配电网调度影响较大的问题,充分考虑源荷数据相关性,提出基于模型预测控制(MPC)的主动配电网多场景变时间尺度优化调度策略.在日前、日内优化阶段,采用藤Copula模型描述源荷相关性,结合场景生成与削减技术形成源荷出力场景,以多场景下配电网期望运行成本最小为目标建立优化模型,求解配电网中机组、储能、无功补偿装置等可调资源运行状态及出力情况;在实时优化阶段,采用MPC思想,以可调资源调整量最小为目标,提出场景相似度的概念以及自适应追踪最优轨迹的方法,得到基于滚动优化和反馈以及最优参考轨迹
提出一种仅需要有限的相量测量单元(PMU)便能实现单故障和多重故障定位的配电网故障定位方法.首先通过叠加原理和等效变换推导故障网络节点电压方程,基于此建立压缩感知模型.然后利用l1正则化最小二乘法求解近似故障电流并进行归一化处理,确定疑似故障区间.通过电压残差公式和故障测距公式依次计算可能故障数目下对应的电压残差和故障距离,根据计算结果判定真实故障区间和故障位置.IEEE 33节点配电系统仿真实验表明:在有限PM U量测信息下,所提方法受故障类型、过渡电阻影响较小,适用于单故障和多重故障的场景,且具有一定
基于半桥型子模块拓扑的模块化多电平换流器不具备直流短路故障电流阻断能力,影响了低成本架空线的应用.为抑制直流故障时的短路电流,研究了 一种新跨接单极三电平子模块拓扑,解决了混合拓扑中电容不均衡充电问题.然后为应对子模块闭锁对换流站和电网可能产生的不利影响,设计了 一种新跨接正、负极三电平子模块拓扑,并分析了其过调制运行、降直流电压运行和桥臂电流方向变化工况时所提拓扑的正、负电平输出要求,进一步减少了子模块中功率器件数量并研究了其控制策略.最后在PSCAD/EMTDC中搭建仿真模型,对所提新跨接双极三电平子
为了解决目前基于电能路由器(EER)的配电网能量优化普遍缺乏对故障恢复的研究及能量路由损耗过大的问题,同时考虑稳定运行与故障恢复2种工况,提出了一种基于EER的配电网分层能量优化策略,其包括下层局域电网(E-LAN)内的能量优化以及上层广域电网(E-WAN)内的能量路由优化.对于稳定运行工况,提出了以最小化运行总成本为目标的E-LAN能量优化策略,以及以最小损耗就地消纳的E-WAN路由优化策略,路由优化策略在保障可再生能源就地消纳的同时,实现电能损耗最小化.对于故障恢复工况,提出了以最大化累计上网电量为目
基于循环神经网络的负荷预测模型大多将历史负荷数据和影响负荷的其他因素如气象数据等共同作为预测模型的输入特征,但气象数据内部规律性不强,不适合作为循环神经网络的输入.针对该问题,提出一种基于Attention-BiLSTM神经网络和气象数据修正的短期负荷预测模型.采用最大信息系数分析影响负荷的主要因素;考虑到负荷序列较长且存在双向信息流,利用BiLSTM神经网络进行预测;引入注意力机制,通过注意力权重突出关键因素的影响,挖掘负荷数据的内部规律;利用核极限学习机结合气象数据进行误差预测和修正,完成负荷预测.以
针对已有消弧柜和柔性电压消弧技术未考虑故障线路阻抗压降问题,提出基于故障点处电压抑制的配电网单相接地故障柔性电压消弧新方法.通过2次注入补偿电流计算中性点至故障点压降,再调控零序电压至该压降,将故障点处电压抑制为0.为防止2次注入任意电流导致接地故障电流增大的问题,提出将柔性电流消弧法作为柔性电压消弧新方法投入前的过渡.考虑故障相误选的影响,提出故障选相新方法,推导了单相接地故障后的零序电压与故障相电源电压的相位关系,通过相位比对选出故障相.最后,结合柔性电压消弧法自适应线路参数变化的优点,提出以柔性电压
花瓣式配电网具有高供电可靠性,但闭环运行模式和逆变型分布式电源接入使其故障特性变得更加复杂.针对含逆变型分布式电源花瓣式配电网的单相接地故障,利用对称分量法推导了故障点接地电流、故障相电流及线路各序电流的公式,并揭示了各电流的变化规律,然后通过仿真对分析结果的正确性进行了验证.结果表明,随故障点按顺时针方向沿花瓣式环网移动,故障点上游侧线路的各序电流及故障相电流幅值呈减小趋势,故障点下游侧线路的各序电流及故障相电流幅值呈增大趋势;逆变型分布式电源并网点与变电站母线之间非故障线路上的负序电流幅值单调递增、相
小波变换是一种重要的信号处理方式,需要采取合适的变换形式,提高算法的有效性,保障信号的识别效果.基于此,将从小波变换、数据处理、变换解析、变换算法4个方面对小波变换在水声信号处理中的应用进行了分析,对小波变换使用方法进行了深入探讨,采取正确的小波变换算法,使水声信号的处理更加的精确,更具有实际意义.
图像描述的任务是根据输入图像自动生成描述该图像的语句,属于计算机视觉与自然语言处理的交叉领域.针对传统注意力机制提取特征能力不足、模型复杂且训练困难等问题,本文提出了一种改进注意力机制的图像描述模型.在传统注意力机制的基础上引入高效通道注意模块,在提升特征提取效果的同时降低模型复杂度,在保证性能的同时提高模型效率,更好的提取图像重要部分特征,生成更为准确的自然语言描述.模型在MSCOCO数据集上进行了验证,实验结果表明,相较于传统的注意力机制,模型在生成描述语句准确性方面有较大提升,在BLEU-1、BLE
针对车载、机载等嵌入式计算系统对小体积、低功耗、高计算能力等方面的要求,基于多核处理器设计了一款非对称嵌入式数据处理模块,该模块对外通过光纤互联网络和其余设备高速连通交互,具有良好的互连通性和互操作性.采用非对称嵌入式系统架构,模块内各处理器内核可根据不同的任务等级或安全等级,部署不同的的任务,为整体提供公共计算能力同时时兼顾容错特性,有助于上层管理系统动态规划分配任务,提升系统性能.模块可适配嵌入式实时操作系统,具备良好的计算能力和实时性.