基于两步决策与ε-greedy探索的增强学习频谱分配算法

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:seesmile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在认知无线网络中,认知基站需要进行频谱管理来提升非授权用户的服务质量。基站在寻找频谱空洞分配给非授权用户的过程中,需要做出最好的选择,但极可能是局部最优解,从而造成非授权用户频繁的频谱切换和吞吐率的下降。针对此问题,本文提出基于两步决策与探索的集中式增强学习频谱分配算法。通过设计新型状态动作集,认知基站进行信道分配的两步决策,并应用探索模式,解决认知基站在增强学习过程中探索环境和利用经验进行决策的平衡问题,防止决策的局部最优,提升频谱管理的性能。仿真结果表明,该算法在提升非授权用户吞吐率以及降低频谱切换方
其他文献
为策应国家"一带一路"发展的向纵深推进,南昌乃至江西的一批拥有不同优势的本土国有、民营企业,带着微笑与友谊"走出去",为沿线国家送去了技术、资金和就业岗位。在"一带一路"的时
由成龙、黄子韬、王凯主演的动作喜剧大片《铁道飞虎》,以草根英雄互掐、自黑,在奔驰的火车上与敌斗智斗勇,最终完胜并频频制造笑点的诙谐效果,彻底颠覆了以往红色经典"高大全
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
《国际法院规约》第38条第一款第三项明文规定了"一般法律原则",这一规定是出于适应国际法现实发展变化的需要。当今国际社会正面临着发展普遍性的规范以解决全球问题的迫切
2016年底,江苏盐城市公安局交通巡逻警察支队官方微博@盐城交警一次性发出两张海报,提醒骑电动车的人们遵守交通规则.一张为"像我们这个年纪,骑电动车一定要记住戴安全头盔,否
伴随着对英语教学方法要求的不断提升,信息沟理论开始逐渐被教学界认可,并在大学英语口语教学中得到了广泛的应用。常用的"信息沟"运用形式包括口头拼板阅读法、共同克服障碍