Top K学习自动机算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:fugle0908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习分为三类:监督学习、非监督学习和强化学习。学习自动机(Learning Automata,LA)是强化学习中重要的一类算法。学习自动机通过与环境的交互,在不需要对环境有先验知识的前提下通过自主学习从环境的行为集中找出最优行为。学习自动机因其实现简单、理论完备以及抗干扰能力强被广泛应用于模式识别、通信等领域。由于实际应用的需求,针对新型的Top K学习自动机的研究逐渐开始。Top K学习自动机的目标是从环境的行为集中找出最优行为子集,更适合一些工业环境以及全局优化等实际应用中。在此背景下,本文对Top K学习自动机的算法进行研究。目前这方面的研究还在起步阶段,现有的算法只是对单个普通学习自动机算法进行了扩展,使其能寻找最优行为子集。为了能将现有的大量普通学习自动机应用到这一新目标中,本文通过分析普通学习自动机算法和新的Top K学习自动机机理,提出两种将主流普通学习自动机扩展为Top K学习自动机的扩展框架——Naive Top K扩展框架及Integral Top K扩展框架并给出了这两种框架的具体流程,并在此基础上针对经典的DPRI算法给出了扩展示例。通过仿真实验,本文出示了两种扩展框架各自的优缺点。其次,本文针对Top K学习自动机与普通学习自动机目标的差异进行深入研究,提出了一种新的Top K学习自动机算法——LELAK算法。这种算法的更新过程从理论上更吻合Top K学习自动机寻找最优行为子集的目的。仿真实验表明,LELAK算法的收敛速度优于现有的Top K学习自动机算法。此外,由于Top K学习自动机的迭代次数相对较多,为了进一步提高效率,本文还对LELAK算法进行了并行结构的实现。通过并行多个Top K学习自动机,加快与环境交互的次数以减少迭代次数。仿真实验表明,并行后的LELAK学习自动机收敛速度显著提升。
其他文献
学位
近几十年来,云环境中的数据共享已成为一个热门话题。随着云计算的普及,如何在云环境中实现安全高效的数据共享是一个亟待解决的问题。此外,如何实现匿名性和可追踪性也是云计算中数据共享的一个挑战。迄今为止,已经有很多专家学者致力于研究专门针对云数据共享的方案。然而现有云数据共享方案大都面临效率较低、隐私难以保护等问题。本文提出一种能够同时支持匿名性和可追踪性的数据共享方案。首先,在多方数据共享环境下,为了
主动学习是机器学习领域中一个重要的研究分支。主动学习研究的是如何通过有选择性的获取那些最有信息量的样本的标签,使得我们可以用尽可能少的训练数据训练出高质量的模型,从而降低样本标签的获取成本。目前,主动学习的研究主要面向平衡数据的分类问题。然而在很多实际问题中,数据的类别分布是不平衡的,并且我们需要考虑到不同的分类错误所造成的不同代价。这种问题称为代价敏感分类问题。主动学习和代价敏感分类在实际生产生
多Agent系统(Multi-Agent System,MAS)是人工智能领域非常活跃的研究方向,其目标旨在使软件能够模拟人类的认知和行为,具有较强的问题求解能力。BDI模型具有高度灵活性,为解决动态复杂领域的问题提供了坚实基础,通过赋予Agent信念(Belief)、愿望(Desire)、意图(Intention)三种精神属性分别表达其所处环境的信息、动机以及实现期望目标所需的规划。在BDI模型
在经济全球化背景下,经济与社会间进行了更新整合,并形成在经济上拥有竞争能力的城市区域,这样的基本单元由“门户城市”及从属于门户城市的腹地,二者可看作是一个整体,即拥
学位
拉力传感器是一种将物理形变转变为可测量的电信号输出的装置。传统拉力传感器常用于基建设施,对于穿戴式应用过于庞大,不够灵敏。随着物联网时代到来,可穿戴设备兴起,轻便透明、易于集成、与人体直接交互这些特性是新型拉力传感器研究的主要方向。考虑这些目标要求,该论文设计了一种基于超薄弹性聚二甲基硅氧烷(polydimethylsiloxane,PDMS)拉力传感器。该传感器采用全溶液法工艺完成,通过在形成的
研究目的:探讨青蒿琥酯(ART)对小鼠结肠炎中巨噬细胞(MQ)与树突状细胞(DC)凋亡的影响,以及(探讨)对胃肠道神经内分泌肿瘤(GI-NETs)最适的内镜治疗方法。内容和方法:(1)C57BL/6(WT)小鼠和联
随着国家“精准医疗”战略的不断实施,人们对于医疗质量提出了越来越高的要求。外科手术导航与机器人系统作为精准医疗的重要工具,能够有效地帮助医生进行术前规划并通过手术
情感表达是人们沟通交流的重要部分。情感表达对于更充分、更细腻表达思想和情感具有十分重要的意义。掌握德语中的情感表达词汇与句法,可以提高和丰富德语学习者的表达能力;