基于平均奖赏强化学习算法的零阶分类元系统

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:njcxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
零阶学习分类元系统ZCS(Zeroth-levelClassifierSystem)作为一种基于遗传的机器学习技术(Genetics-BasedMachineLearning),在解决多步学习问题上,已展现出应用价值。然而标准的ZCS系统采用折扣奖赏强化学习技术,难于适应更为广泛的应用领域。基于ZCS的现有框架,提出了一种采用平均奖赏强化学习技术(R-学习算法)的分类元系统,将ZCS中的折扣奖赏强化学习方法替换为R-学习算法,从而使ZCS一方面可应用于需要优化平均奖赏的问题领域,另一方面则可求解规模较大、
其他文献
近年来,江苏省徐州市启动“基础教育全面学南通”活动。我作为徐州市云龙区赴南通市学习的第一批成员,踏上了南行的列车。在为期2个月的跟岗学习中,我对这座有着丰润文化背景
<正>目的比较合成乳腺X线摄影(SM)和数字乳腺X线摄影(DM)与数字乳腺断层成像(DBT)联合或单独使用时评估微钙化的效能。方法本回顾性研究包括2013年1月—
目的探讨综合护理干预对青少年中耳炎患者依从性和疼痛的影响。方法选择2013年12月至2016年12月间我院收治的行药物治疗的青少年中耳炎患者60例为研究对象,随机分为两组各30例
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
以人为本,社会成员和谐相处是和谐社会的直接特征。在构建人与人、人与组织、人与社会以及人与自然的和谐相处的社会关系中,必须重视社会成员的心理和谐。心理和谐,行为才能和谐
为了研究隧道施工双层预支护体系的协同作用机制和作用效果,考虑管棚、旋喷桩、注浆等预加固方式的协同作用,将双层预支护结构等效为梁单元,将预支护结构之间的土体视作弹簧
Lancet Diabetes Endocrinol杂志的个人观点栏目近期发表了一篇文章,提出2型糖尿病肾功能损伤的“无蛋白尿途径”。长期以来,大多数基于1型糖尿病的数据显示,糖尿病肾病的自
目的分析先天性血管环的产前超声诊断特点。方法选取2011年9月—2014年10月在惠州市中心人民医院行产前超声筛查的孕妇共36 124例,其中诊断出血管环形成10例,分析该10例胎儿
目的:观察鼻窦炎手术后疼痛情况,指导术后镇痛。方法:187例慢性鼻窦炎伴或不伴鼻息肉手术患者,按麻醉方式分为全身麻醉组和局部麻醉组。记录患者年龄、性别、体重、手术名称;术后2
采用“心理健康诊断测验”(MHT)和“家庭功能评定量表”(FAD)调查郑州市重点、普通高中二年级共236人,并对结果进行相关分析。结果表明:沟通与学习焦虑、对人焦虑、孤独倾向