基于RBF神经网络和强化学习算法的供应链产销协同计划冲突消解研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:mrcool111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高传统协商自学习能力,利用多agent智能技术,建立基于黑板模型的协商框架,构建五元组协商模型,采取Q-强化学习算法,给出一种协商策略;使用RBF神经网络进一步优化协商策略,预测对手信息并调整让步幅度。通过算例验证该方法的可行性和有效性,通过与未改进的Q-强化学习算法对比,该方法可增强协商agent的自学习能力,缩短协商时间,提高冲突消解效率。
其他文献
为满足多种任务快速反应的需求,提出了一个基于成像资源能力的多星区域观测任务规划方法。该方法对成像资源能力进行了形式化描述,提出了成像资源能力的测量框架以及计算资源能力的依据,通过对分析目标观测区域覆盖面方法进行研究,给出基于成像资源能力的区域任务观测规划算法,并通过测试实例对上述结论进行了验证。结果表明提出的区域任务观测规划算法能够有效地促进多卫星在重叠区域的协作,提高了规划效率。
现有的多核学习算法大多假设训练样本分类完全正确,将其应用到受扰分类样本上时,由于分类存在差错,因此往往只能实现次优性能。为了解决这一问题,首先将受扰分类多核学习问题建模为随机规划问题,并得到一种极小极大表达式;然后提出基于复合梯度映射的一阶学习算法对问题进行求解。理论分析表明,该算法的收敛速度为O(1/T),大大快于传统算法的收敛速度O(1槡/T)。最后,基于五个UCI数据集的实验结果也验证了本文
通过引入熵的概念,提出了基于不重叠路径数的标准稳定熵指标,用于刻画节点间抗毁性随不重叠路径数变化的规律。在此基础上给出了用于全网抗毁性评估的模型。同时指出了评价模型中涉及的节点间不重叠路径数的计算方法。最后通过算例分析以及与最短路径法相比较,论证了基于不重叠路径熵的模型在网络抗毁性评估方面具有更高的准确性与合理性。