基于情节序列训练的电子市场智能定价算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:caolippp123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以B2B电子市场中卖方agent的智能定价问题为应用背景,在库诺特短视调整基础上,应用Q学习算法,提出了基于情节序列训练的学习方法,将纯粹以结果为反馈的强化学习方法和以推理为目标的慎思过程结合起来,提高了算法的在线学习性能。仿真实验验证了算法的有效性,为推向实际应用奠定了基础。
其他文献
医院感染控制已经成为医疗管理的重要核心部分,医院感染管理成效也逐渐成为医院综合治疗评价的主要指标之一。检验科为医院核心科室,工作人员需要接触患者带病菌标本接触,如
采用基于Helmholtz自由能推导的混凝土损伤本构方程,结合弹性模量损伤因子和残余应变影响因子,构建了CRTSⅢ型板式轨道充填层自密实混凝土(Self-compacting Concrete,SCC)疲
目的:了解河北省某高校大学生营养知信行情况,分析其可能存在的问题,为后期健康宣教提供科学依据。方法:采用随机整群抽样方法,于2017年3月在河北省保定市某高校抽取调查对象
介绍了近年来我校的热能与动力工程专业在理论教学的课程设置和实践教学的安排上所做的教学改革及成果,重点介绍了实践教学中实习环节的内容安排,以及目前在实习企业的选择、
目的探讨非酒精性脂肪肝(NFL)肝脏脂肪浸润程度与胰岛素抵抗的关系.方法检测NFL组26例和正常对照组18例的血脂、血糖、胰岛素、游离脂肪酸(FFA),采用稳态模式评价胰岛素抵抗(
中共中央关于《推进领导干部能上能下若干规定(试行)》印发以来,德令哈市委严格按照全面从严治党、从严治吏要求,立足德令哈实际,在推进领导干部能上能下相关要求落地生根方面