基于改进深度Q学习的网络选择算法

来源 :电子与信息学报 | 被引量 : 0次 | 上传用户:coolfish_dj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在引入休眠机制的超密集异构无线网络中,针对网络动态性增强,导致切换性能下降的问题,该文提出一种基于改进深度Q学习的网络选择算法.首先,根据网络的动态性分析,构建深度Q学习选网模型;其次,将深度Q学习选网模型中线下训练模块的训练样本与权值,通过迁移学习,将其迁移到线上决策模块中;最后,利用迁移的训练样本及权值加速训练神经网络,得到最佳选网策略.实验结果表明,该文算法显著改善了因休眠机制导致的高动态性网络切换性能下降问题,同时降低了传统深度Q学习算法在线上选网过程中的时间复杂度.
其他文献
针对现有网络流量异常检测方法不适用于实时无线传感器网络(WSN)检测环境、缺乏合理异常判决机制的问题,该文提出一种基于平衡迭代规约层次聚类(BIRCH)的WSN流量异常检测方案.该方案在扩充流量特征维度的基础上,利用BIRCH算法对流量特征进行聚类,通过设计动态簇阈值和邻居簇序号优化BIRCH聚类过程,以提高算法的聚类质量和性能鲁棒性.进一步,设计基于拐点的综合判决机制,结合预测、聚类结果对流量进行异常检测,保证方案的检测准确性.实验结果表明,所提方案在检测效果和检测性能稳定性上具有较为明显的优势.
期刊
为解决其他访问控制机制向基于属性的访问控制机制迁移过程中所面临的策略生成问题,该文提出一种基于访问控制日志的访问控制策略生成方法,利用基于机器学习分类器的递归属性消除法实现策略属性的选择,基于信息不纯度从日志记录中提炼出蕴含的属性-权限关系,结合实体属性选择的结果,构建策略结构树,实现基于属性的访问控制(ABAC)策略的生成,并设计了基于二分搜索的策略生成优化算法实现对最优策略生成结果的快速计算.实验结果表明,只需原始实体属性集中32.56%的属性信息即可实现对日志中95%的策略覆盖,并且能够将策略规模压
为了满足便携式电子设备的需求,设计了一种低漏失高稳定的LDO.利用正反馈环路钳位电压,获得高精度采样电流.通过调整工作在深线性区的MOS管的等效电阻,产生跟踪负载电流的零点.设置负载电流监测电路,控制大负载电流下的跟踪零点,对输出极点进行补偿.结合阻抗衰减技术,实现LDO在全负载范围内的稳定;通过将第一级运放输出端极点推离原点,减小电源抑制比在中频的衰减.基于0.18μm CMOS工艺完成电路和版图的设计,电路最大负载电流为500 mA.仿真结果表明,在不同负载电流下,LDO环路最小相位裕度为52°,PS
针对互质阵列产生连续延迟较少且冗余度高的问题,该文提出了两种基于互质阵列的稀疏设计方法.首先,通过分析阵元位置对互质阵列差分共阵总延迟和连续延迟影响,得出互质阵列在去掉特定阵元后,将不改变连续延迟拓扑.然后,优化传感器阵列布局,在保持整个阵列的阵元数不变的条件下,增加阵列连续延迟数量.其后,分别推得了两种提出阵列设计方法的连续延迟和自由度相关的数学表达式.最后,以相同物理传感器和相同估计方法开展对比仿真,验证提出稀疏阵列设计的DOA估计性能.
当既定侦察区域存在多个数目未知且信号参数相似的脉冲串辐射源信号时,采用经典的多目标定位算法和直接定位算法(DPD)均无法对多个辐射源信号进行精确定位.该文提出了一种基于位置信息累积的脉冲串直接定位算法(L-DPD).算法采用多个运动侦察站对固定目标辐射源进行信号接收,充分利用脉冲串信号的位置信息并联合各脉冲的时延、频移信息对目标进行直接定位,解决了经典的直接定位法无法对时频空域混叠信号有效定位的问题.同时该文推导了高斯白噪声背景下相参脉冲信号直接定位算法的克拉美罗界.仿真分析表明,算法可以对时频空域混叠信
信道建模与仿真是短波航空通信系统性能分析评估的基础,该文通过分析研究飞行器最大移动速度、加速度、机动频率、运动轨迹等机动状态参数对短波航空移动信道时变多普勒频移的影响,提出一种基于Watter-son模型的短波航空移动信道模型.该模型能够充分描述由收发两端相对运动引入的信道多普勒频移与扩展,适用于短波超视距航空移动通信信道.仿真结果表明,该模型能够实现对不同种类不同机动状态飞行器短波移动通信信道的差异化仿真,还能在已知航线航迹时,实现对特定场景下的定制化信道仿真.
传统暗原色理论的相关算法,在处理雾天图像时会产生颜色的畸变和亮度的损失,针对该情况,该文提出基于权重多曝光融合的单幅雾天图像复原算法.首先通过雾天图像的直方图分析,获取全局大气背景光值的区域.其次构造一种新的Kirsh算子的高阶差分滤波方法,优化透射率图像.最后设计一种基于显著性权重的多曝光图像融合方法,提高处理后图像的视觉效果.该文采用自然图像和合成图像进行实验,与多种算法通过主观和客观评价,表明该文算法比现有的算法有更高的复原效果.
为了发展快速稳定的广义特征向量估计算法,该文提出基于神经网络的新型单维广义特征向量估计算法;通过分析该算法的所有平衡点证明了当且仅当神经网络权向量等于最小广义特征值对应的广义特征向量时该算法达到稳定状态;利用确定性离散时间分析方法完成了所提算法的动态特性分析,给出了保证算法收敛的边界条件;通过膨胀技术将单维算法扩展为多维广义特征向量估计算法,该算法可以根据实际需要增加提取广义特征向量的数量.仿真实验表明所提算法具有很好地收敛性,而且收敛速度优于一些现有算法.
该文首先简要介绍了2021年国家自然科学基金分类评审机制以及“负责任、讲信誉、计贡献”(RCC)评审机制等主要改革举措;其次按照四类科学问题属性对2021年信息一处面上、青年、地区、重点和优青项目申请的受理和资助情况进行了统计和分析;然后根据RCC试点方案,对科学处通讯评审的“负责任”、“计贡献”两项指标进行了相关信息的分析;最后分析了申请代码与研究方向选择中的问题,并对专家维护、更新专家库信息和评审意见撰写提出了建议.
期刊