论文部分内容阅读
联盟博弈(coalitional games)一直是多agent系统(multi-agent systems,MAS)和人工智能领域的一个非常重要和活跃的方向。究其原因,联盟提供了一种灵活的协作方式,让一些独立的agent在一定时间内结成一个协作团队,相互联合起来实现优势互补和资源共享,从而能够更加智慧、灵活和高效的完成目标。然而,现有研究大都局限于确定性环境,需要预先给出每个agent拥有的能力或资源的定量描述,难以适应不确定性环境下的协作。此外,虽然联盟博弈方法已在电子商务、无线网络和多机器人协作等领域中使用,但其应用还有待进一步拓展,尤其是在灾害应急响应中的应用还有待深入研究。
基于上述背景,本文首先针对技能结盟博弈(coalitional skill games,CSGs)中的联盟结构生成问题开展研究,并基于“灾害应急响应联盟”的思想,探索了应急救灾物资分配和调度集成优化问题,研发了安徽省省市县乡四级救灾物资储备、分配和调度集成系统,有助于为国家高效、有序的应对重大自然灾害提供更加科学的决策参考。
本文的主要研究内容及创新之处如下:
(1)CSGs是一种简单的不确定环境下的协作模型。在CSGs中,每个agent都拥有若干特长或技能,并被要求完成一组具有不同技能需求的任务。一般而言,这些特长或技能很难去定量的衡量,只能加以简单的定性描述。迄今为止,关于CSGs的可计算性问题已经被广泛的研究,但联盟结构生成作为CSGs中的一个极具挑战性的核心难点问题并没有得到很好的解决。为此,本文评估了二进制粒子群优化(binary particle swarm optimization,BPSO)和二进制差异演化(binary differential evolution,BDE)这两种演化计算技术在求解CSGs中的联盟结构生成问题上的可用性。具体来说,本文将上述两种算法扩充到二维二进制编码,并提出相应的启发式方法对不可行个体进行修正。而且,本文推演了所提的启发式方法的计算复杂度并论证了其有效性,即本文的启发式算法可以确保将任意不可行个体修正为一个可行个体。最后,本文将改进后的HBPSO和HBDE与两个代表性的确定性算法进行对比实验和分析。实验结果表明,本文的启发式方法可以为HBPSO和HBDE提供强有力的启发式信息,增强算法的探索能力和效率,尤其在面对大样本数据时,本文的算法可以找到更好的解,而且耗费的时间远低于对比的确定性算法。
(2)在灾害应急响应中,救灾物资的分配和调度具有天然的内在关联性,分配环节给出的储备点的救灾物资贡献量和位置必然会影响调度环节的运输时间,从而影响整个应急过程的响应时间。因此,将应急救灾物资分配和调度集成起来统一优化更具有现实意义,也能从整体上提高应急响应效率。为此,本文引入联盟博弈中的“协作联盟”思想,以期基于“灾害应急响应联盟(disaster emergency response coalition,DERC)”的协作方式实现多种救援力量的统筹调度和协同作战。首先,基于agent联盟构建了应急响应网络的数学模型;然后利用Dijkstra算法和应急响应时间约束对应急响应网络进行裁剪,只保留所有的储备点、发放点和每个储备点到其可达的发放点的最短路段(即包含了原始网络的最短路径);其次,设计二维整数向量编码来表示多储备点、多发放点和多种救灾物资的分配和调度集成优化问题的解,通过在编码中提取启发式信息进一步裁减应急响应网络;对含有多个储备点的DERC,采用基于最短通行时间的贪心算法实现救灾物资分配,并通过解码在应急响应网络上标出救灾物资分配和调度方案。与已有工作的对比实验结果显示,本文所提的基于启发式和贪心的快速混合搜索算法在耗费时间上具有绝对的优势,还不到四种对比算法运行时间的2%,而且在最大应急响应时间和运输成本这两个优化目标上的整体表现也要明显优于已有算法。
(3)我国是世界上自然灾害影响最为严重的国家之一,灾害种类多,分布地域广,发生频率高,造成损失重。然而,与欧美日等发达国家相比,我国在救灾
物资的科学分配和智慧调度等方面存在着较大的差距,仍然处于主要依靠“行业经验”做决策的状况。国务院在2016年的《关于印发国家综合防灾减灾规划(2016-2020年)的通知》中明确提出了“要提高防灾减灾救灾工作规范化、现代化水平,强化科技创新,有效提高防灾减灾救灾科技支撑能力和水平”。为此,本文基于安徽省“省市县乡”四级救灾物资储备网,依托阿里云服务器架构,采用Java Web后端编程技术、MySQL和百度地图API,并结合前端编程语言HTML、CSS、JavaScript和JQuery等,设计和实现了救灾物资分配和调度集成系统,从而对各项技术的统一性和可行性进行了有效性验证,为政府高效、有序的应对重大自然灾害提供一套示范性解决方案。
基于上述背景,本文首先针对技能结盟博弈(coalitional skill games,CSGs)中的联盟结构生成问题开展研究,并基于“灾害应急响应联盟”的思想,探索了应急救灾物资分配和调度集成优化问题,研发了安徽省省市县乡四级救灾物资储备、分配和调度集成系统,有助于为国家高效、有序的应对重大自然灾害提供更加科学的决策参考。
本文的主要研究内容及创新之处如下:
(1)CSGs是一种简单的不确定环境下的协作模型。在CSGs中,每个agent都拥有若干特长或技能,并被要求完成一组具有不同技能需求的任务。一般而言,这些特长或技能很难去定量的衡量,只能加以简单的定性描述。迄今为止,关于CSGs的可计算性问题已经被广泛的研究,但联盟结构生成作为CSGs中的一个极具挑战性的核心难点问题并没有得到很好的解决。为此,本文评估了二进制粒子群优化(binary particle swarm optimization,BPSO)和二进制差异演化(binary differential evolution,BDE)这两种演化计算技术在求解CSGs中的联盟结构生成问题上的可用性。具体来说,本文将上述两种算法扩充到二维二进制编码,并提出相应的启发式方法对不可行个体进行修正。而且,本文推演了所提的启发式方法的计算复杂度并论证了其有效性,即本文的启发式算法可以确保将任意不可行个体修正为一个可行个体。最后,本文将改进后的HBPSO和HBDE与两个代表性的确定性算法进行对比实验和分析。实验结果表明,本文的启发式方法可以为HBPSO和HBDE提供强有力的启发式信息,增强算法的探索能力和效率,尤其在面对大样本数据时,本文的算法可以找到更好的解,而且耗费的时间远低于对比的确定性算法。
(2)在灾害应急响应中,救灾物资的分配和调度具有天然的内在关联性,分配环节给出的储备点的救灾物资贡献量和位置必然会影响调度环节的运输时间,从而影响整个应急过程的响应时间。因此,将应急救灾物资分配和调度集成起来统一优化更具有现实意义,也能从整体上提高应急响应效率。为此,本文引入联盟博弈中的“协作联盟”思想,以期基于“灾害应急响应联盟(disaster emergency response coalition,DERC)”的协作方式实现多种救援力量的统筹调度和协同作战。首先,基于agent联盟构建了应急响应网络的数学模型;然后利用Dijkstra算法和应急响应时间约束对应急响应网络进行裁剪,只保留所有的储备点、发放点和每个储备点到其可达的发放点的最短路段(即包含了原始网络的最短路径);其次,设计二维整数向量编码来表示多储备点、多发放点和多种救灾物资的分配和调度集成优化问题的解,通过在编码中提取启发式信息进一步裁减应急响应网络;对含有多个储备点的DERC,采用基于最短通行时间的贪心算法实现救灾物资分配,并通过解码在应急响应网络上标出救灾物资分配和调度方案。与已有工作的对比实验结果显示,本文所提的基于启发式和贪心的快速混合搜索算法在耗费时间上具有绝对的优势,还不到四种对比算法运行时间的2%,而且在最大应急响应时间和运输成本这两个优化目标上的整体表现也要明显优于已有算法。
(3)我国是世界上自然灾害影响最为严重的国家之一,灾害种类多,分布地域广,发生频率高,造成损失重。然而,与欧美日等发达国家相比,我国在救灾
物资的科学分配和智慧调度等方面存在着较大的差距,仍然处于主要依靠“行业经验”做决策的状况。国务院在2016年的《关于印发国家综合防灾减灾规划(2016-2020年)的通知》中明确提出了“要提高防灾减灾救灾工作规范化、现代化水平,强化科技创新,有效提高防灾减灾救灾科技支撑能力和水平”。为此,本文基于安徽省“省市县乡”四级救灾物资储备网,依托阿里云服务器架构,采用Java Web后端编程技术、MySQL和百度地图API,并结合前端编程语言HTML、CSS、JavaScript和JQuery等,设计和实现了救灾物资分配和调度集成系统,从而对各项技术的统一性和可行性进行了有效性验证,为政府高效、有序的应对重大自然灾害提供一套示范性解决方案。