论文部分内容阅读
空间布局优化问题是一类在地理学研究领域广泛存在的复杂空间问题,由于在实际生产、生活中的此类优化问题的解数量众多、解空间巨大,同时涉及到很多空间信息,因此求解比较困难。随着生物群体智能和进化计算等智能计算方法在解决高维、非线性问题上的优越性日益凸显,采用智能计算方法解决空间优化问题也开始得到地理学领域内诸多学者的重视。布谷鸟算法(Cuckoo Search,CS)作为一种新的群智能优化算法,具有很强的全局寻优能力,可以弥补其他常用智能优化算法容易陷入局部最优的不足,已经在工程科学与自然科学领域中得到广泛应用,本文尝试引入布谷鸟算法解决空间布局优化问题。 随着大数据时代的到来,空间布局优化问题的规模和求解空间也越来越大,即使智能优化方法也几乎不可能在合理的时间内有效解决此类问题。云计算作为一个新兴的并行处理技术,融合了并行计算、分布式计算和网格计算的特点,在解决涉及大规模数据问题时,具有卓越的性能表现。但当前主流的基于Hadoop云计算平台的MapReduce计算模型存在I/O读写瓶颈,不适合于迭代式的智能优化算法,而基于分布式内存的Spark框架的出现为迭代算法的效率提升提供了新的途径。因此本文提出了基于Spark的并行布谷鸟算法的空间布局优化方法,主要研究内容有: (1)针对空间布局优化求解空间较大的问题以及其他算法存在的不足,引入具有较强全局搜索能力的布谷鸟算法。首先对布谷鸟算法原理、内部机制进行了分析,探讨了采用布谷鸟算法解决空间布局优化问题的方法和步骤,在布谷鸟算法框架的基础上提出了针对空间布局的优化算子和更新策略,以适应空间布局优化的要求,重新定义了布谷鸟算法中个体的编码方式、初始方案的生成、综合适应度函数以及约束条件的处理方法,以满足空间布局优化的要求,提高算法的收敛效率和求解精度。 (2)针对大数据时代组合优化问题搜索空间过大,运算时间过长问题,提出基于云计算的并行布谷鸟算法。根据布谷鸟算法的特点提出了基于主流云计算模式MapReduce的布谷鸟算法和新兴Spark框架的布谷鸟算法并行化方案。但对于迭代式的智能优化算法,MapReduce存在I/O读写效率问题,因此本文重点实现了基于Spark的并行布谷鸟算法优化算法。主要思路是将布谷鸟算法个体和输入数据封装为弹性分布式数据集(Resilient Distributed Datasets,RDD),并设计一系列的弹性分布式数据集的转换操作完成算法并行。借助Spark分布式内存框架的计算优势,显著提高迭代式智能优化算法的求解速度和运算效率。 (3)以云南省红河哈尼族彝族自治州(简称“红河州”)为例,建立多目标优化的烟草种植空间布局优化模型,通过3个对比实验验证本文提出的基于云计算的并行布谷鸟算法在求解精度和运行效率等方面的提升。 通过分析研究区云南省红河州的烟草种植自然环境概况、当前烟草种植现状和存在的问题,以及影响烟草种植的因素,建立了包括适宜性目标、聚集度目标和轮作率目标的多目标烟草种植的空间布局优化模型,然后通过三个实验验证本文提出基于Spark的改进布谷鸟算法的优越性。实验一,将本文提出的面向空间布局优化的布谷鸟算法和经典的智能优化算法遗传算法、粒子群算法以及基本的布谷鸟算法做对比,验证了本文改进布谷鸟算法应用于烟草种植空间布局优化问题时收敛效率、求解精度和稳定性都有明显优势。实验二,将基于新兴云计算框架Spark的改进布谷鸟算法(Improved Cuckoo Search,S-ICS)与基于主流的云计算模式MapReduce的布谷鸟算法(M-ICS)做对比,验证了基于Spark的布谷鸟算法比基于MapReduce的布谷鸟算法在运算效率上有大约20倍左右的提升。实验一和实验二验证了基于Spark的布谷鸟算法在求解精度和运行效率上的优越性,说明基于Spark的布谷鸟算法是一种高效的空间布局优化方法。因此在第三个实验中,采用S-ICS对研究区进行了2016烟草种植空间布局的规划,并从适宜性、聚集度和轮作率三个优化目标,与以往三年的烟草种植布局进行对比,说明其科学性和合理性。由此证明本文提出的基于Spark的并行布谷鸟算法在空间布局优化问题上的有效性和优越性。