基于在线学习的多Agent协商

来源 :郑州大学 | 被引量 : 0次 | 上传用户:zhyanhz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet的飞速发展已经深刻地影响着传统商业模式的运作,电子商务已经被越来越多的人所接受,目前基于Agent的电子商务研究成为业界研究热点。如何快速、高效地进行Agent协商,已经成为经济学家和计算机学者共同研讨的一个主要方向。 基于Agent的协商可看作在信息不完全的状态下个性Agent之间既竞争又合作的决策过程。对于多Agent系统而言,由于它是一个开放的动态系统,因此要求协商过程能够适应环境的动态变化。理论分析表明,如果在协商的多Agent系统中引入学习机制,使得每个Agent通过学习来协调自身的行为,则能有效地完成协商目的。本文正是基于这样一个背景开展工作的。 本文主要研究了在基于Agent的双边多议题协商中,如何应用在线学习机制来提高协商效率。文章首先参考Zeng,Sycara(1997)等人关于协商学习的模型并加以改进,提出了相关开放有效的协商模型。在该协商模型的基础上引入贝叶斯学习机制,并分别对更新信念、生成提议等协商过程作了详细阐述。在限时条件下的多议题协商中,为了当协商进入僵持状态时参与协商的买卖双方能确定是否进行妥协,从而使协商继续进行下去,本文在贝叶斯学习的基础上提出了基于不妥协度的协商策略,从而使协商过程不至于在一些无关紧要的冲突点终止。实验表明在协商过程中进行学习可以提高对方私有信息的预测精确度,缩短了协商时间,提高了协商效率。 协商是一个动态的复杂过程,协商双方彼此之间保密自己的私有信息。本文采用贝叶斯网络学习来更新Agent关于环境和其他个体的信念,从而使Agent在协商交互中能够对协商对手的保留值动态预测,更有效地进行交互推理。并实验证明其可行性。
其他文献
随着信息产业特别是互联网的高速发展,人们可以很容易得从互联网、数字图书馆以及公司内部网络获得海量的数据。这些数据按照其组织形式可分为:结构化的数据(如数据库记录等)、
电信IP网络规模正在日益扩大,业务也在不断出新,建设功能强大的综合IP网络管理系统对网络运营商具有重要的实际意义。资源管理子系统作为综合IP网络管理系统的基础,是综合IP
随着计算机网络在社会各行业的应用的不断深入,人们对于计算机网络的依赖程度日益增强。由于网络的开放性、网络协议的固有弱点、网络连接形式的多样性、信息的共享和易于扩散
自从Internet诞生以来,互联网上的信息正以指数形式飞速增长。如何在WWW这个全球最大的数据集合中发现用户的有用信息已成为数据挖掘研究的热点,Web数据挖掘也由此应运而生。
3GPP在R5中提出的IP多媒体子系统(IMS)汇集了移动通信领域最先进的概念和技术,它在以下三个方面进行了改善:QoS保证、计费控制和对不同业务的融合,为进一步在PS域上开展新业务提
信任管理基于实体的属性而不是身份进行访问控制,克服了传统的基于身份的访问控制方法在分布式环境中的不足,能够满足基于属性访问控制的需求。信任管理系统的中心思想是一致
随着电子商务规模的进一步扩大,为顾客提供越来越多选择的同时,其结构也变得更加复杂。一方面,顾客面对大量的商品信息束手无策,经常会迷失在大量的商品信息空间中,无法顺利找到自
本文对基于MVC设计模式的Struts框架的研究与应用进行了研究。文章首先介绍适合于构建复杂商务应用的J2EE框架及其相关技术,对J2EE框架的特点进行分析。阐述MVC设计模式的思想
工作流技术是实现企业业务过程建模、过程管理与过程自动化的核心技术。随着信息技术的发展和计算机应用的普及,工作流技术正在受到越来越多的关注。在与工作流相关的各类技术
在企业中,动态监测是生产管理的重要工作内容,也是保证企业正常、安全、经济运行的重要手段。在西方发达国家,自动化数据采集与控制系统已经成为生产的配套设施。将现场信息和管