论文部分内容阅读
近年来,基于图形处理器GPU的通用计算逐渐成为主流计算模式。为了降低GPU程序设计的难度,提出一种适合于GPU体系结构的非阻塞并行队列数据结构。通过对并行队列进行语义松弛,该数据结构能够有效利用队列操作的并行性。同时,还提出了高速并行队列插入和删除算法。使用线性化准则对该并行队列的正确性进行验证。实验表明,所提出的并发队列能够达到远高于目前多核CPU和GPU并行队列的性能,分别超越现有最好结果 20倍和200倍以上。