【摘 要】
:
随着互联网的高速发展,人们生活的各个方面都离不开互联网,人们在享受互联网带来便捷生活的同时,也使得互联网数据高速增长。如何快速查询和存储海量数据已成为人们研究的重点,这也使得NoSQL数据库快速发展。比较典型的NoSQL数据存储形式是键值存储,即一个键对应一个值。键值存储系统可以理解为一个可持久化的更大容量的哈希表。存储系统最重要的部分是存储引擎,本文研究了当前最流行的日志结构合并树(LSM-Tr
论文部分内容阅读
随着互联网的高速发展,人们生活的各个方面都离不开互联网,人们在享受互联网带来便捷生活的同时,也使得互联网数据高速增长。如何快速查询和存储海量数据已成为人们研究的重点,这也使得NoSQL数据库快速发展。比较典型的NoSQL数据存储形式是键值存储,即一个键对应一个值。键值存储系统可以理解为一个可持久化的更大容量的哈希表。存储系统最重要的部分是存储引擎,本文研究了当前最流行的日志结构合并树(LSM-Tree)存储引擎。基于日志结构合并树的存储引擎核心思想是顺序写入,将修改的数据排序后保存在内存,达到一定规模后再将内存中修改的数据批量刷入磁盘,并且在写入过程中与之前已经存在的磁盘数据进行合并,合并的过程中丢弃掉旧的键值数据。日志结构合并树最大的问题就是合并操作产生的磁盘I/O开销,极大地影响了写性能,严重情况下写速度取决于合并速度。本文的研究目的就是解决日志结构合并树的写放大问题,提高合并效率,从而提升日志结构合并树的写入性能。与传统的日志结构合并树实现相比,本文通过增加一层索引层,并采用键值分开存储的方式。键的后面紧跟着的不再是值,而是指向值所在的地址,称其为值索引,以此避免值参与合并压缩操作,从而减少合并带来的磁盘I/O开销,提升合并速度。键值分开存储在牺牲一定读性能的前提下,大大减少了合并操作引起的磁盘I/O开销,极大地提高了写性能。本文基于日志结构合并树,采取了键值分离的存储方式,增加了索引层以及独特的旧数据回收算法,设计与实现了一个键值存储系统。并与基于传统的日志结构合并树的存储系统Leveldb进行读写性能对比,实验结果表明了本系统具有更好的写性能,特别是在值字节数较多以及写压力大的场景下,性能优势更加明显。
其他文献
很多西方国家都经历过大部制改革,并形成了各自的改革经验。实行大部制改革的目的就是使政府职能可以在最大限度内被发挥出来,降低行政成本。深入思考分析这些国家的改革实践
近年来,云计算技术发展迅速,虚拟化技术作为云计算的关键技术,一直是研究的热点问题之一。虚拟化技术包括多个方面,如网络虚拟化、虚拟机放置、虚拟机迁移等。本论文主要关注
利用太阳能对建筑物供暖,由于在缓解资源枯竭和保护环境等方面有着不可替代的优势,受到了各国政府和学者的高度重视。与民用建筑不同,工业建筑的太阳能供暖有其独有的特点。
泛滥平原湖泊是全球生产力最高的生态系统之一,为人类的文明发展提供了基本的生态功能和服务。长江中下游流域湖泊众多、河网密集,包含广泛的洪泛平原和湖泊,是世界上罕有的淡水物种资源库,生物生产力极高。鄱阳湖是我国最大的且与长江干流自由联系淡水湖泊,长江、鄱阳湖及其五条入湖河流之间形成了复杂的江-湖-河复合生态系统。浮游动物是淡水生态系统的主要成分,其个体小,对水情变化非常敏感,对维持水生态系统的稳定性具
以黄粉虫为原料,研究了有机溶剂法提取黄粉虫油脂的工艺。对影响萃取率的因素:溶剂的选择、固液比、提取温度及时间等条件进行研究,并做正交试验,确定了获得最大提取率的条件
国内外润滑油品牌共同面对着的是一个消费结构升级的市场。家用轿车的逐渐普及,车型的不断更新,国人养车护车意识日渐的提高,都强烈地刺激着高端润滑油市场的发展。虽然先期
微通道板(MCP)在制作过程中微通道内表面会吸附大量气体,这些气体会导致MCP的寿命缩短、噪声增加、灵敏度下降。为了满足大尺寸微通道板的性能测试和电子清刷除气处理的需求,设计了一种电子枪,可以产生尺寸大、均匀性好、动态范围宽的平面电子源。该电子枪采用功函数较低的钽丝,加工成盘香式结构,通过外加电场,使得出射后打到微通道板输入面上的电子源束流密度可调,均匀性优于90%,对于电子清刷12小时内的稳定性
甲状腺激素受体相互作用因子4(TRIP4)是核转录共活化因子1复合物(ASC-1)的亚基,介导核受体相互作用,促进基础转录因子转录。近年来研究表明,TRIP4在多种肿瘤中高表达,并可能
全球化是世界经济发展的重要趋势,全球化从多个维度对世界的经济、政治、文化、社会甚至城市发展产生深远的影响。而中国经济发展进入新常态,经济重心心往西部迁移,以及国家
分布式发电(Distributed Generators,DGs)是布置在用户附近的小型发电单元,主要包括太阳能发电、风力发电、生物质能发电等,但是它们都有很大的随机性、间接性和波动性,无法对用电单位做到稳定可持续供应电能,DGs接入到大电网时,会对大电网带来冲击,造成一定的影响,为了削弱DGs直接并网的弊端,微电网作为一种新型的电网形式被提出,微电网有两种运行状态:并网模式和孤岛模式。当微电网受