基于GPU的查询技术并行化研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：shengli1011

【摘要】

：

作为数据管理领域一类非常重要的技术，数据库技术在很多行业中得到了广泛应用。其中，查询技术是数据库技术的核心部分。当前，查询技术领域存在如何加快索引更新以及如何设计满足

【作者】

：

黄玉龙

【出处】

：

华南理工大学

【发表日期】

：

2013年期

【关键词】

：

GPU通用计算线性哈希表批量插入 B+树批量构建及插入并行XPath求值分段Top-k查询查询技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为数据管理领域一类非常重要的技术，数据库技术在很多行业中得到了广泛应用。其中，查询技术是数据库技术的核心部分。当前，查询技术领域存在如何加快索引更新以及如何设计满足查询任务的高效查询算法这两个研究方向。因此，利用GPU等新兴并行硬件改善索引更新效率以及大规模数据的查询性能受到了越来越多的关注。在索引更新过程中，插入和删除是两个基本并且互逆操作。与此同时，随着互联网应用以及个性化服务的兴起，XML查询以及top-k查询也逐渐成为研究热点。为此，在总结以及分析相关工作的基础上，本文主要研究了以下内容：总结了现有的索引构建及插入、大规模数据查询算法。结合本文的工作内容，详细阐述了GPU通用计算技术及其主流开发工具—CUDA。在此基础上，进一步介绍和分析了本文使用的并行操作原语。针对当前线性哈希表的并发插入需要加锁的现状，结合GPU在排序方面拥有的显著优势，提出了一种无锁批量插入算法GSInsert4LHT以及相应的存储结构。在批量插入过程中，该算法采用一个线程插入一条记录策略，从而极大地提升了线性哈希表的插入性能。在不同参数设置条件下，与4线程多核算法相比，GSInsert4LHT算法的性能提升了10.26~13.54倍。在此基础上，进一步阐述了如何利用该算法来加快Wetoband系统的资源操作权限判断过程。为了优化B+树的构建及插入性能，首先设计了一种键值空间分配策略，在此基础上进一步给出了基于GPU的批量构建及插入算法CUBPT。实验表明，与4线程批量建树算法相比，CUBPT算法的建树性能提升了21.76~25.1倍。此外，由于CUBPT算法在键值的批量插入过程中负载非常均衡，因此该算法在此阶段的性能比4线程PALM算法提升了9.49~19.2倍。由于性能优势明显，在此还给出了如何将该算法集成到Wetoband系统，从而提升资源对象的查找效率。研究了基于GPU的XPath并行查询算法。首先分析了当前XPath并行查询算法M2以及GPU-Twig等在存储空间以及线程资源利用率方面的不足。在此基础上，扩展了流标签存储机制中节点的Zhang编码结构，提出了一种基于关系数组的大规模XPath查询算法GXQ。在构建关系数组时，GXQ算法首先计算出与每个关系节点关联的第一个以及第二个XML节点下标。在此基础上，快速构建关系数组。在并行查询过程中，采用对每个步骤的返回结果标记策略，从而减少了空间分配代价以及去重代价。通过实验比较发现，在不考虑M2算法中关系矩阵构建时间的情况下，与4线程M~2算法相比，GXQ算法的性能加速比最高可达16.1倍。研究快速top-k查询算法。针对当前并行top-k查询算法存储空间利用率差以及不具通用性等方面的劣势，结合经典的NRA以及LARA算法，设计了一种基于GPU的快速查询算法CNRA。与传统算法一次处理一个有序列表层次不同， CNRA算法在增长以及收缩阶段均采用一次处理STRIDE个层次的策略，从而显著减少了每个对象的分值上下界更新时间以及top-k对象的判断比较时间。实验结果表明算法的性能有了明显提升，最高可达107.6倍。然而当STRIDE值增大时，算法的性能提升效果反而有所下降，这与算法在更新分值下界过程中使用的策略有关。

其他文献

干旱、半干旱区旅游资源开发的生态安全评价与开发模式研究

旅游资源只有通过开发才能形成旅游产业，带来经济效益。目前的旅游资源及其开发评价侧重质量和经济价值方面的评价，而对生态环境方面的评价较少。干旱、半干旱区是我国著名的生

学位

干旱半干旱区旅游资源开发生态安全评价鄂尔多斯市

儿童哮喘急性发作的门急诊处理(综述)

<正> 1994年1月美国儿科医学会质量改进临时委员会哮喘组发表了《儿童哮喘急性发作的处理》一文已引起儿科医学界的重视。本文就其出台的背景综述如下。问题的提出据统计美

期刊

儿童哮喘急性发作急诊室雾化吸入门急诊

实际杆塔接地极冲击特性的大电流试验研究与仿真分析

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

杆塔接地极冲击特性现场试验土壤非线性电离CDEGS仿真接地极优化

新人才培养模式下《医药高等数学》课堂教学的实践

根据新人才培养模式下医药学专业学生的培养目标,结合医药高等数学的课程特点,提出了基于优化教学内容,重视培养数学思维和应用能力的医药高等数学课堂教学改革方案。

期刊

新人才培养模式医药高等数学数学思维the training mode of new talentshigher mathematics in medici

基于模态回归的半参数部分线性模型的稳健估计

以半参数部分线性模型为对象,研究了基于模态回归的稳健估计方法。非参数部分采用B样条近似,在模型的回归中通过控制核函数的带宽来实现估计的稳健性,结合局部二次算法(LQA)

期刊

半参数部分线性模型模态回归B样条稳健估计核函数带宽

沈阳市发展循环经济的问题与对策

循环经济是20世纪以来兴起的统筹经济、社会、环境协调发展的一种新的发展模式。这种发展模式以科技含量高、经济效益好、资源消耗低、环境污染少、发展人力资源、以最小的资

期刊

循环经济可持续发展经济模式

四辊轧机中支撑辊长度和辊颈长度对板形的影响

<正>现在比过去任何时候都更重视带材的厚度及平直度的均匀性。对精确度的要求,特别是用于计算机工业更为严格。轧制带材不匀,须去掉边部,从而损失了实际产量。在过去,保证厚

期刊

支撑辊压下量工作辊四辊轧机

论高职数学课程第一课教学创新的理性精神

高职数学课程第一课教学创新是将过去教师以介绍课程性质为主要目的的单独说课创新为学生首先说课,学生、教师相互倾听,教师融入对话再跟进说课。它体现出了教学理性精神中求

期刊

高职数学第一课创新理性精神higher vocational mathematicsthe first lessoninnovationrational

基于GPU的查询技术并行化研究

其他学术论文