基于GPU加速的细粒度并行蚁群算法

被引量 : 0次 | 上传用户:gaoq183
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蚁群优化算法(Ant colony optimization algorithm,ACO)源于对蚂蚁觅食行为的研究,是一种基于群体智能方法的演化计算技术,在实际工程中表现出巨大的潜力。但在数值建模和优化计算等许多领域中,处理大量数据和求解大规模复杂问题时,ACO算法依然需要大量的计算时间,而并行ACO算法由于能较大幅度缩减问题求解的时间,因此成为一个研究热点。当前并行ACO算法主要在并行机上运行或用多线程技术模拟,主要存在下述不足:进程间通信损耗限制了粒子规模;大多数研究人员没有硬件环境,无法使用并行机解决问题;多线程技术是在CPU上用串行模拟并行,不能真正提高性能。近年来,计算机图形处理器(Graphics processing unit,GPU)绘制流水线的高速度和并行性以及近年来发展起来的可编程功能,使其在通用计算领域的应用有着巨大的潜力。CUDA是Nvidia公司推出的GPU编程的统一计算设备架构。在统一计算设备架构下,GPU执行的模式是并发的线程。多个线程可以组成一个线程块。一个线程块中的线程能存取同一块公用的存储空间,而且可以快速进行同步的动作。本文针对传统并行蚁群算法在实际应用中的不足,结合GPU的高速并行性,提出了一种基于GPU加速的细粒度并行蚁群算法(GPUACO),将并行ACO求解过程转化为CUDA内核,使用CUDA线程块模拟蚂蚁个体,使ACO算法在GPU中加速执行。本文主要以最大最小蚂蚁系统和蚁群系统的并行实现为例,详细描述了算法设计思想和程序实现过程,提供了各自应用于对称TSP问题的实验结果,与相应串行算法在相同计算环境下的实验结果做出比较,并针对实验结果分析了GPUACO算法的特点。实验结果表明本文算法在取得了较好的优化效果的同时,解决了细粒度并行的蚁群规模限制问题,提高了算法的运算速度。
其他文献
1现状折叠臂式随车起重机的力矩限制通常选用电磁力矩限制装置,由于其成本较高且安装空间限制,一直没有全面推广。自GB6067-2010《起重机械安全规范》颁布以后,流动式起重机要必
<正>教学是一门丰富多彩的艺术,在新课程理念的引导下,以往那种机械的"我讲你听"的课堂格局势必会被打破,学生们不再是接受知识的容器,他们的智慧火花时时闪现,他们的"奇思妙
本文将着重介绍近年来国外在迫击炮和追击炮弹上所采用的新技术以及未来的发展趋势。
语码转换是语言交际和跨文化交际中的一个普遍现象。近年来,应用语言学家和语言教师基于二语习得理论和课堂实际教学探讨语码转换在语言教学中的作用,论证课堂语码转换的模式
安徽省是我国中部地区经济较落后的农业大省。农产品资源丰富,品种多、产量大。粮食、油料、水产品等产量位居全国前列,还有茶叶、烟叶、水果、中药材等重要的经济作物。近年
南五味子为木兰科植物华中五味子(Schisandra sphenanthem Rehd.Et Wils.)的干燥成熟果实。现代药理研究表明其木脂素类成分具有较强的降低转氨酶,保肝的作用。但其总木脂素
现场可编程门阵列(FPGA,Field Programmable Gate Array)由于能够进行编程、除错、再编程的重复操作,并可以充分进行开发验证,被认为是构建半导体芯片开发设计原型的最快途径
语素是重要的语法单位之一,不同语言对语素的界定与认识是有区别的。汉语语素的界定需要结合汉语自身特点来考虑,简单地以形式或者意义作为标准都会遇到很多问题。如果从语言
本文介绍了利用卡尔曼滤波算法,实施微机距离保护的方法,该设计方案共分五个主要部分:故障检测,故障后电流和电压的估计,故障分类,区域计算和故障定位。并着重介绍了在向量信号处理
提高学生英语写作能力是高校大学英语教学的根本目标之一,但是我国非英语专业大学生英语的写作现状不容乐观,出现的主要问题有搭配错误、汉语式英语和文章连贯性差等。近年来