【摘 要】
:
互联网时代产生的海量数据亟待高效的数据管理方案,数据的索引技术是高效管理数据的关键技术之一。现有基于内存的索引技术(如B+树类)已经无法高效地满足数据总量不断快速增长的场景。新型非易失内存(Non-Volatile Memory,NVM)具有接近内存的性能、存储密度大于内存,是构建下一代存储系统的重要存储设备。但是,目前应用广泛的B+树索引并不能很好地适应大容量的NVM设备,其性能随着所索引的数据
论文部分内容阅读
互联网时代产生的海量数据亟待高效的数据管理方案,数据的索引技术是高效管理数据的关键技术之一。现有基于内存的索引技术(如B+树类)已经无法高效地满足数据总量不断快速增长的场景。新型非易失内存(Non-Volatile Memory,NVM)具有接近内存的性能、存储密度大于内存,是构建下一代存储系统的重要存储设备。但是,目前应用广泛的B+树索引并不能很好地适应大容量的NVM设备,其性能随着所索引的数据总量的增加而降低。最近出现的学习型索引(Learned Index,LI)的性能只与模型的规模有关,是解决NVM上大数据量导致索引性能下降的关键。针对如何使用NVM来高效地索引海量数据的问题,提出一种基于NVM的新型智能索引结构LI-Tree,该结构能较好地适应数据量的增长的同时,具有高效的单点性能和范围查询性能。LI-Tree采用一种三层的结构设计:以学习索引组成的模型层、静态数组构成的数据索引层和以一系列轻量级B+树(Lbtree)组成的数据层。LI-Tree通过模型层的学习索引来降低数据层B+树的高度,从而提高LI-Tree的单点性能;通过静态的数据索引层来维持整个结构有序,从而支持范围查询;数据层的轻量级B+树利用了B+树在树高较低时的良好性能,在支持数据插入操作的同时避免了模型层的频繁重训练过程。另外,LI-Tree设计了多线程后台扩展操作来适应数据量的增长,通过扩展操作来维持轻量级B+树具有较低的高度,使得整体结构在数据量不断增长时仍能保持良好的性能。在真实的NVM内存设备上,实现了LI-Tree的系统原型,并与针对NVM优化的典型B+树索引结构Fast-Fair进行了性能对比。测试结果表明,对比Fast-Fair,LITree的插入性能可提高70%,查询性能提高30%,删除性能提高130%,且在数据量不断增长时仍能维持较高性能。另外,LI-Tree与其它学习型索引结构对比,插入性能提升了80%到150%。
其他文献
随着经济的发展,人们越来越注重个人修养和文化素质的提高,更多的人认识到音乐的魅力。各种乐器的学习热潮逐渐掀起,作为主流乐器之一的架子鼓也得到了进一步的推广。目前国内的架子鼓教育仍面临专业教师资源稀缺、学习经济成本大、学习效率低下以及学习周期长等问题,以教师教学为主的架子鼓传统陪练不能完全满足现阶段架子鼓学习群体的需求。针对原声架子鼓教学场景,本文利用物联网设备和人工智能技术,设计并实现了一套价格低
弹簧载荷安全阀是一种安装于压力容器或者管路系统中,用于在系统发生超压时进行节流、泄压的安全设备。由于弹簧载荷安全阀的复杂结构,在对高压流体进行泄压排放时,无疑会在阀门内部及上下游管道出现较为紊乱的湍流流动,从而产生剧烈的振动,进而对压力容器或管路设备产生一定程度的损伤,同时其流致噪声也会对工作人员的听觉健康产生危害。因此,对弹簧载荷安全阀内的非定常流动特性进行研究,并对安全阀流致噪声进行准确预测,
随着人工智能的井喷式发展,其涉及的伦理风险,也从科幻作品中走进现实,成为众多主体热议的话题。本文以技术接受模型及风险感知理论为基础,以信任为中介,构建了公众对于人工智能伦理风险的感知与其参与风险治理意愿的研究框架,并通过实证检验了相关假设。结果显示:人工智能伦理风险感知对公众参与意向具有显著的负向影响,其中公众对科研机构和政府的信任在人工智能伦理风险感知与公众参与之间起部分中介作用。该结论为构建“
目的:建立二乙基亚硝胺(diethylnitrosamine,DEN)诱导的原位大鼠肝癌模型,评价该动物肝癌模型的病理学特性及其在肝癌经动脉化疗栓塞(transarterial chemoembolization,TACE)中的应用价值。材料和方法:本研究采用浓度为0.01%的DEN口服诱导的方法建立大鼠原位肝癌模型60只(雄性,平均体重160-180g),将其分为肿瘤模型组(n=40)和TACE
PROFINET是由西门子公司和PROFIBUS国际组织推出的新一代基于工业以太网技术的自动化总线标准,适用于多种工业控制领域,在我国有广大的应用市场。但由于当前国产基于PROFINET的伺服产品较少且实时性能较差,不利于国产伺服品牌竞争力的提升。针对以上问题,本文提出了一种基于ERTEC200P的PROFINET伺服从站接口实现方案。在分析PROFINET通信系统从站结构基础上,根据伺服从站的功
二氧化钛具有价格低、储量高、电化学性质稳定等优点。然而,较低的电导率和电催化活性限制了其在电催化领域的广泛应用。各种方法,包括掺杂金属或非金属,形貌调节、异质结、缺陷工程等被用来改善TiO2的电催化性能。其中,贵金属改性的方法被认为是最好的方法。本文采用贵金属掺杂方式提升TiO2电催化性能,改性后TiO2表现出更高效的电催化析氢性能(HER)和高效氮还原(NRR)性能。主要研究内容和结果具体如下:
高粘度流体在化工、食品、机械、石油、航天等领域应用广泛。高粘度流体因其粘度较高流动特性较差,输送时流动阻力较大、动能消耗大。因此降低高粘度流体的流动阻力、强化其流动特性具有重要的工程应用价值。本文以高粘度流体在挤压激励下的流动特性为研究对象,深入研究挤压出料系统的结构参数与工艺参数对高粘度流体流动特性的影响规律。本文主要的研究内容和成果如下:首先,提出了挤压激励下高粘度流体出料系统的总体设计方案。
Salen配体是有机化学领域中最重要的配体之一,能与不同氧化态的金属离子配位。传统固载M-Salen配合物的方法主要有浸渍法、离子交换法、瓶中造船法、化学嫁接法、溶胶-凝胶法、有机高分子聚合法等。固载化M-Salen在多相催化、CO2捕获、化学传感器以及电化学领域均有应用。固载化M-Salen催化剂在多相催化领域的应用虽有较多报道,但由于固载化催化剂的制备过程较为繁琐,其在化学合成反应中的实际应用
金属卡宾,尤其是供体受体卡宾,是许多化学反应的重要中间体,在有机合成中具有广泛的应用。目前,受重氮化合物潜在安全问题的限制,N-磺酰基-1,2,3-三氮唑作为一种稳定且具有多样反应活性的卡宾前体替代品,成为了化学合成研究中的热点;其与不饱和化合物通常发生环丙烷化和[3+2]环加成反应;其中值得注意的是,N-磺酰基-1,2,3-三氮唑与烯烃的反应类型较为单一且底物受限。因此,基于前人工作,本文发展了
近年来,随着新型持久性内存(PM)和远端直接内存访问(RDMA)技术的蓬勃发展,低持久存储开销的PM和低传输延迟的RDMA在数据中心环境中得到了广泛的应用。然而,由于RDMA网络接口卡(RNIC)中存在易失性缓存,如何在PM和RDMA结合的系统中高效地保证远端数据持久性成为了重大挑战。持久RDMA操作和RDMA数据更新的可见性在分布式持久内存系统中还没有得到充分的研究。尽管少数基于远端过程调用(R