【摘 要】
:
随着计算机技术的快速发展以及互联网应用的普及,数据规模不断扩大,我们已经进入了大数据时代。尽管传统的关系数据库管理系统(RDBMS)可以提供非常成熟的数据存储和处理方案,但是面对不断增长的数据量,RDBMS分析和处理大数据的能力在可扩展性方面遇到了严重的瓶颈,No SQL数据库应运而生。它使用灵活的数据模型存储大数据,可以很容易地实现扩展性,因此诸如HBase之类的分布式存储系统在数据服务中发挥着
论文部分内容阅读
随着计算机技术的快速发展以及互联网应用的普及,数据规模不断扩大,我们已经进入了大数据时代。尽管传统的关系数据库管理系统(RDBMS)可以提供非常成熟的数据存储和处理方案,但是面对不断增长的数据量,RDBMS分析和处理大数据的能力在可扩展性方面遇到了严重的瓶颈,No SQL数据库应运而生。它使用灵活的数据模型存储大数据,可以很容易地实现扩展性,因此诸如HBase之类的分布式存储系统在数据服务中发挥着重要作用。为了更好地处理和分析大数据,一维辅助索引已被用来访问许多分布式存储系统中的数据。但是,它不能通过简单地聚合多个辅助索引有效地支持多维范围查询。因此,本文提出了基于HBase的一种自适应多维索引策略来有效地执行多维范围查询操作,该策略联合了B+树和Hash表,首先根据要查询的属性建立B+树辅助索引,然后将索引查询得到的相应行键集合映射到Hash表以获得最终匹配结果。实验结果表明,我们的索引策略可以获得较低的响应时间延迟,并且在八维查询条件下,混合索引的响应时间比迭代索引减少了15.75%左右,比MD-HBase方法减少了39.82%左右。针对HBase更新索引时引起的一致性与性能之间的平衡问题,已有的更新策略只注重提高性能,而不关心索引结构和数据表之间的一致性,因此本文结合LRFU算法设计了冷热数据划分策略,并提出了基于HBase的冷热数据自适应多维索引维护策略,异步更新冷数据及其对应的索引并使用查询验证机制,同步更新热数据和索引,从而在一致性和性能之间实现自适应平衡。实验结果表明,自适应维护策略的一致性比异步简化策略强,且两者性能接近。
其他文献
锦屏一级水电站为目前世界最高双曲拱坝,大坝基坑上游面处于基坑f18断层带,岩石地质条件差,岩面渗水严重。本文介绍破碎岩面渗水处理措施,主要采用化学灌浆和固结灌浆相结合的方
本文以绘画创作中“朦胧”意趣表现为出发点,通过对“朦胧”的研究与分析,从而获得新的绘画认知,更好地引导实践创作,寻找出自身新的绘画切入点。清晰反映一种形式的美感,朦
随着双创浪潮的到来,孵化器行业迎来了发展的高峰,各种新型孵化器纷纷涌现,它们的运营模式灵活多样,这给作为传统型孵化器的上海A大学科技园孵化器带来了前所未有的挑战,其原有的传统运营模式急需改进。本文以上海A大学科技园孵化器为研究对象,以其现有运营模式为具体研究内容,首先通过国内外孵化器理论文献的整理对核心概念进行界定,利用PEST模型、SWOT模型分析工具对孵化器现有的内外部战略环境进行分析,然后采
目的探讨抗性淀粉干预糖尿病大鼠对其子代糖代谢的影响。方法 20只6周龄雌性2型糖尿病Goto-Kakizaki(GK)大鼠随机分为抗性淀粉组(GK-RS组,n=10)和等能量密度饲料对照组(GK-EC组,n=
摘 要:做好初高等数学承接教学工作,使大学生尽快掌握高等数学的学习方法。针对初高等数学教学现状,给出承接初高等数学教学的方法,即注重教师的引导工作,培养学生学习数学的兴趣,指导学生适应新的学习模式,提高自学能力,为学好高等数学夯实基础。 关键词:初高等数学;教学方法;学习观念 随着科学社会化的发展,各行业间的联系日益紧密,教育改革逐渐趋于培养应用型全面发展的人才。高等数学无论作为专业必修