基于机器学习的HBase配置参数优化研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:yqmaidou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HBase是一个分布式数据库管理系统,对于需要快速随机访问大量数据的应用程序,它正变得越来越流行。但是,它有许多性能关键配置参数,这些参数之间可能会以复杂的方式相互影响,这使得手动调整它们以获得最佳性能变得极其困难。文中提出了一种新的方法来自动调优给定HBase应用程序的配置参数,称为自动调优HBase。其关键是建立一个以配置参数为输入的低成本性能模型。为此,系统地研究了不同的建模技术,并决定采用集成学习算法来构建性能模型。随后,利用遗传算法通过性能模型为应用程序搜索最优配置参数。因此,它可以快速且自动地
其他文献
目的研究迈之灵联合左西替利嗪治疗静脉曲张性湿疹的临床疗效。方法将105例静脉曲张性湿疹患者随机分成2组,试验组53例,对照组52例。试验组予迈之灵联合左西替利嗪治疗,对照
随着互联网的发展和云计算技术的广泛应用,许多数据存储在不同的服务器上,分布式数据挖掘技术应运而生。智能agent在各自的站点上得到部分挖掘结果,分布式数据挖掘可以将这些部分的挖掘结果聚合成为全局的结果。文中主要处理的是分布式数据挖掘过程中的分类问题,针对一些特征的数据分别存储于不同的数据源上,提出了一种基于判断聚合模型的分类算法。该算法中每一个agent要对一个案例属于某一个目标类的可能性进行判断
目的 探讨骨搬移术治疗胫骨骨折术后感染性大段骨缺损的临床效果。方法 选取我院骨科2016年6月—2018年6月收治的胫骨骨折术后感染性大段骨缺损患者60例,分为对照组30例,采用
又到年底,2016,翻篇在即。从广东省率先资质变资信的一石激起千层浪,到花样年20亿收购万达物业引爆的平地一声雷,再到各种类型大小论坛的轮番登场,2016年的物业管理在一片热
针对文本聚类过程中簇的数量无法动态改变及文本分类结果不够精确等问题,文中引入并改进了成长型分级自组织映射(Growing Hierarchical Self-Organizing Map,GHSOM)算法,以提高文本聚类的精确度,并尝试使用改进后的GHSOM算法构建民航航空法规知识地图。GHSOM算法为多层分级结构,每一层包含数个独立的成长型SOM,通过增长规模来在一定程度上更加详细地描述数据集,
目的对比鼻内镜辅助逆行泪道置管术与泪囊鼻腔吻合术在慢性泪囊炎中的临床疗效。方法选取我院2016年1月—2017年12月50例慢性泪囊炎患者,随机分为观察组与对照组。观察组采用
目的探讨甲硝唑阴道局部应用对子宫全切术后阴道残端愈合的临床疗效。方法选取2009年1月—2016年12月在我院行子宫全切术后患者324例,分为用药组和对照组,每组162例。用药组
目的探讨对子宫脱垂患者采用优质护理服务的效果。方法选取2016年4月—2017年4月在我院行常规护理的子宫脱垂患者41例为对照组,2017年5月—2018年4月在我院行优质护理服务的
云环境下,大规模集群设备将产生海量时序性的告警数据,实际应用中,运维人员通常利用这些告警数据来定位、排查、修复故障和错误,维持系统的正常运行。因此,如何将海量告警数
目的探讨呼出气一氧化氮测定应用于慢性阻塞性肺疾病急性加重期患者中的临床效果。方法选取2016年1月—2017年1月我院收治的46例慢性阻塞性肺疾病急性加重期患者作为观察对象