基于学习的多Agent协商模型研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:youzheng123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Agent的协商环境是开放的、动态变化的,这就要求Agent在协商过程中必须具有很强的应变能力和自治能力。协商之前Agent的这些能力在自身的BDI模型设计中已经确定,因此Agent要想在协商中灵活应对随时可能变化的外部因素,最后取得较好的收益,就必须在协商前对自身的BDI模型做出全面更新,以保证协商模型在交互过程中能够智能的指导Agent做出行为选择。而目前的协商Agent学习算法多存在于协商过程之中,对协商前自身信念中关于对手Agent私有信息的认知度还不高。 本文针对协商前Agent信念的更新问题,构造了一种协商Agent历史学习算法。文中详细分析了多Agent系统中的行为方式和其决策模型,参考Zeng,Sycara(1998)等人关于协商Agent的学习方案,并结合Fatima和Wooldridge(2001)等人对不完全信息情况下Agent协商决策行为的对比矩阵,进一步对多Agent多问题协商系统的协商模型中的内嵌学习机制和决策机制作了深入分析。对比多种已经存在的协商Agent学习算法和决策模型,文中分析了提高这种多Agent系统决策模型能力的可能性。 Agent在协商过程中对协商对手信息的高认知度可以提高Agent自身的决策效率和最终收益。所以本文设计了一个双边多问题协商的Agent历史学习算法。文中在对中间平台数据库中Agent协商历史信息做出分类后,规范定义了算法中协商线程模式和协商支撑模型,随后给出了算法的详细实施方案。 协商Agent历史学习算法通过处理对手Agent的协商历史信息,对协商对手的私有保留信息进行预测。预测结果可以在协商过程开始前对自身的初始信念进行更新,这样就可以增强Agent对协商对手私有信息的认知度,同时可以提高Agent决策模型的决策能力,缩短协商线程。文章通过多组实验数据对该算法进行多方面的对比分析。实验表明,算法的预测结果对Agent协商过程中的动作选择和策略生成具有一定的指导意义。
其他文献
近年来,随着移动通信技术和计算机网络技术的不断进步,ad hoc网络得到快速发展,其组播路由和拥塞控制技术受到越来越多研究者的关注。本文在比较和分析国内外现有组播路由和
本文主要研究一种时间确定性安全关键实时网络协议——时间触发以太网(Time Triggered Ethernet,TTE)。涉及内容包括TTE的网络体系架构、控制协议以及关键构件的设计;然后在仿真
软件再工程自动化是现今软件工程发展的主流。软件再工程过程是软件逆向工程与软件正向工程交替进行的过程。但是,软件逆向工程与软件正向工程相比,无论在分析策略还是在算法复
随着越来越多的网上办公、电子商务的应用,安全问题已经成为Internet进一步普及的一个关键问题。而基于密码学基础的VPN是有效解决在公用网上数据安全传输的一个有效手段。
J2EE是SUN公司定义的一套规范,提供了基于组件的方式来设计、开发、组装和部署企业应用。J2EE平台提供了一个多层次分布式的应用模型,包括了可复用的组件、基于XML的数据交换、
关联分类法将关联规则挖掘技术应用于分类领域,构建了一种新的更准确的分类器。由于关联规则挖掘在挖掘大量数据之间的并发的潜在相关性方面的优势和良好的扩展适应性,使得在其
由于城市交通的迅速发展,道路及其它交通设施的管理水平急待提高。近年来,随着人们对智能交通系统(Intelligent Traffic System,ITS)越来越重视,以及Internet技术、WebGIS技
随着电信业的迅猛发展,用户对各种业务的需求不断增长,原有的电信网络远远不能满足。以软交换为核心的下一代网络技术正是在这种背景下产生并发展起来的。 本文首先概述了NG
MPEG-4作为集中各种多媒体应用于一体的新一代压缩标准得到广泛应用,而其中基于内容的编码标准因其应用的优势成为MPEG-4标准的重要特色之一。本文选择视频信息中频繁出现的视
信息的内容安全已经成为信息安全技术架构中重要组成部分。内容安全技术是继防火墙、网络入侵监测技术之后的又一种网络安全手段。作为互联网上最广泛的应用——电子邮件,研