【摘 要】
:
随着科技以及经济实力的快速发展,数据的传播速度以及数据的存储量都在显著增长。由于传统的关系型数据库对数据的完整性及安全性有着一定的要求,这对系统的可用性及伸缩性有着一定影响,并导致系统的数据操作速度变慢,数据管理变得困难。这些影响在某些对实时性有要求的功能模块或者系统上是不可忽视的。同时在这几年,需要进行管理的数据的维度也在增加。比如,近年来民航的快速发展,一次航班的飞行,每时每刻都有成百上千个传
论文部分内容阅读
随着科技以及经济实力的快速发展,数据的传播速度以及数据的存储量都在显著增长。由于传统的关系型数据库对数据的完整性及安全性有着一定的要求,这对系统的可用性及伸缩性有着一定影响,并导致系统的数据操作速度变慢,数据管理变得困难。这些影响在某些对实时性有要求的功能模块或者系统上是不可忽视的。同时在这几年,需要进行管理的数据的维度也在增加。比如,近年来民航的快速发展,一次航班的飞行,每时每刻都有成百上千个传感器进行数据采集。在可预见的未来,民航业内为了飞行效率以及飞行安全,还需要扩展更多的数据采集维度。这使得民航系统中对于非关系型数据库的应用变得越来越普遍。非关系型数据库HBase是一个面向列存储的分布式存储系统,相对于传统的关系型数据库而言,HBase的维度扩展方便并且提供高并发读写操作的支持。本文选择HBase存储系统作为研究对象,针对多维时序数据的特点,通过寻找一组最优的配置参数,以提升HBase的性能。本文的研究内容主要有以下几个方面:(1)HBase的配置参数筛选以及训练样本的生成。筛选有效的配置参数并采用随机策略生成一系列配置文件。使用YCSB测试工具,收集每个配置文件对应的性能数据。(2)HBase的性能预测模型构建与优化。采用随机森林算法与XGBoost分别构建吞吐量以及平均延迟四个预测模型,其中会先通过贝叶斯优化算法优化模型参数。然后将吞吐量与平均延迟模型进行加权和得到两个组合模型,对比两组合模型的误差,选择最优的模型。(3)HBase配置参数寻优。通过改进的遗传算法对HBase的性能模型进行寻优,获得模型最优解所相对应的一组最优配置参数。(4)优化前后配置参数的性能对比。通过在实际环境中测试优化前后的配置参数对HBase性能的影响,来论证本文基于HBase配置参数的性能优化的有效性。
其他文献
建筑物震后损伤评估是地震灾害损失评估、震后恢复和重建工作的重要内容之一。建筑物震后损伤评估要现场找出结构损伤或破坏位置并对其进行分类统计和分析,它不仅提供了有关
随着铁路维修体制向集中化、专业化、自动化等方面发展,建立以分析、诊断技术为基础的电务设备一体化维护平台势在必行.以一体化平台为依托,通过先进的计算机网络技术,制定统
圆柱绕流一直以来是流体研究的一个重要方向,桥梁结构的斜拉索是典型的圆柱体,斜拉索的风致振动会影响桥梁结构的耐久性。因此柱体绕流的研究具有重要的工程意义和研究价值。
随着旅游业的快速发展,以特定主题著称的旅游目的地“主题公园”作为旅游业中发展比较迅速的旅游产品,其竞争也日趋白热化。互联网时代的到来使移动客户端已成为新常态,受众习惯也随之改变,与传统媒体截然不同的新媒体进入了大众视野,其交互性、即时性、个性化与社群化的特征,成为各个行业所青睐的新型营销工具。我国各大主题公园在市场营销方面,也尝试运用网络技术和新媒体资源来完善营销策略,但目前较大程度上仍局限于网络
<正>当前,我们国家新发的伪狂犬病毒(PRV)流行毒株与欧美国家猪伪狂犬病病毒经典毒株(Bartha-K61代表株)从基因型上来说,处于不同的分支,流行毒株已经形成一个独立的基因型,
居住空间作为城市中最基础与最重要的功能空间,与城市中各项功能空间具有强烈的联动发展关系,城市整体的可持续发展离不开居住空间合理发展所起到的重要作用。在当前我国城市
随着经济的发展,改革开放进程的加快,汽轮机行业占据一席之地,而火力发电厂热力系统重要的一部分是汽轮机的节能改造,汽轮机的使用为国家进一步发展奠定了基础,而新材料和新
大型发电设备制造企业通常是与客户签订合同后再安排设计、采购与制造,产品本身生产周期长、投入高。近年来随着国家政策的变动、激烈的市场竞争环境以及越来越个性化的订单