【摘 要】
:
近几年来,以深度强化学习(Deep Reinforcement Learning,DRL)为代表的人工智能技术被引入计算机网络系统设计中,促使网络领域走向数据驱动和智能化,并在典型的网络系统中不断
【机 构】
:
复旦大学计算机科学技术学院,复旦大学信息科学与工程学院,上海市智能信息处理重点实验室
【基金项目】
:
国家自然科学基金项目(61772139,61971145),上海市港澳台科技合作项目(18510760900),广东省重点领域研发计划项目(2020B010166003)
论文部分内容阅读
近几年来,以深度强化学习(Deep Reinforcement Learning,DRL)为代表的人工智能技术被引入计算机网络系统设计中,促使网络领域走向数据驱动和智能化,并在典型的网络系统中不断取得新的突破。计算机网络应用的难点是难以对多变的网络环境进行复杂准确的建模,借助深度神经网络出色的特征提取能力,深度强化学习能够更好地以试错的方式探索更优的决策,并具有端到端的设计优势。首先阐述深度强化学习技术的原理,包括多种典型的深度学习中使用的神经网络结构、基于值函数和基于策略梯度的深度强化学习训练算法;之后
其他文献
这是福山(图1)。每年金黄色的十月.刚刚进入景观专门化学习的学生就来到实践的第个基地——福山。景观认知和空间设计训练.就从这里开始。
利用文献计量学的方法,就目前网络舆论这一研究热点的研究文献,从年发文量、发文机构、期刊来源、学科类别、关键词、被引频次和下载频次等几方面进行统计分析,以期从中一窥
流言:很多网友认为,用免洗洗手液或酒精给手消毒,效果比用肥皂洗手好。真相:这种观点不正确。首先,我们要弄清楚洗手到底洗掉的是什么:一是肉眼看得见的灰尘和污垢,二是肉眼
在大量文献阅读、实地勘探、现场采访的基础上,梳理国瓷小镇的建设前景,并运用SWOT分析法分析国瓷小镇建设面临的优势、劣势、机会和威胁。提出国瓷小镇旅游规划发展应强化规
目的:采用Meta分析的方法对艾灸治疗膝骨性关节炎的临床疗效进行全面的分析研究。方法:采用电子检索结合手工检索两大方法检索国内外大型文献数据库,主要研究对象为满足纳入
[目的]为通过构建昆嵛山腮扁叶蜂虫基指数(Pest based index,PBI)评价体系,定量评价出与林分因子共同作用后,立地因子对赤松纯林中昆嵛山腮扁叶蜂发生程度的作用等级。[方法]
颈椎病在祖国医学中属“项痹”范畴。主要是指颈椎间盘退行性变、颈椎骨质增生、颈部韧带钙化,颈椎小关节紊乱刺激或压迫了邻近的神经根、脊髓、血管等,出现相应临床症状及体征
目的通过对肺科陪护工结核病防护知识及相关陪护知识与行为状况的符合率调查,发现存在的问题,分析“知行不一”现象发生的可能原因及防范对策。方法采用设计好的调查表调查30位
本文将以对比语言学相关理论为指导,对中英文歌曲中的歌词进行分析研究。同时,研究将以韩礼德和哈桑的衔接理论为基础,深入剖析中英文歌词衔接的不同手段,并将从语言学、文化和思
新的时代背景下,教育界不断地出现教与学的角色转变,教师成为倾听者符合儿童发展的需要,越来越受到教育界的重视。教师的教学倾听能力能让师幼互动更加顺利,教学活动更加有效,无论是对幼儿的全面发展,还是对教师本人的教学成长都有着重要意义。在此基础上,本研究以德惠市五所幼儿园参与教学活动的所有一线教师为研究对象,对其教学倾听能力的现状进行了调查。笔者通过访谈法、问卷调查法以及观察法,获取研究资料。通过对教师